أكثر

كيفية تجميع الأدوات داخل مربع أدوات Python في ArcMap 10.2

كيفية تجميع الأدوات داخل مربع أدوات Python في ArcMap 10.2


لقد قمت بإنشاء مربع أدوات Python بسيط في العمل لاستخدامه في ArcMap 10.2. يتم استخدامه من قبل العديد من الموظفين لذلك آمل أن أجعله سهل الاستخدام قدر الإمكان. يحتوي حاليًا على نصين فقط ولكن لدي نصوص أخرى أخطط لإضافتها في المستقبل. أستخدم حاليًا السطر أدناه لتحميل الأداتين عند بدء التشغيل ، وبينما لا بأس بذلك مع نصين فقط ، فقد يصبح غير مرتب عند إضافة المزيد.

self.tools = [opentemplatecsv، batchcsvtopdf]

من الأفضل أن يكون لديك صندوق أدوات واحد (مثل "أدوات Dave") يحتوي على عدة مجموعات فرعية (مثل "أدوات رسم الخرائط" و "أدوات النمذجة" و "أدوات الهيدرولوجيا") ، كل منها يحتوي على البرامج النصية المناسبة التي كتبتها.

هل هناك طريقة لوضع الأدوات في مجموعات فرعية ضمن مربع الأدوات الرئيسي ، أم أنه من الأفضل إضافة بضعة أحرف إلى بداية أسماء البرامج النصية لفرزها أبجديًا؟

بمعنى آخر.

الخريطة - الأداة رقم 1

الخريطة - الأداة رقم 2

مدير الجلسة - الأداة رقم 3

HYD - الأداة رقم 4

إلخ…


تعيينالفئةالسمة على أداتك.

class MyTool (كائن): def __init __ (self): self.label = "هذه الأداة الخاصة" self.description = "هذه الأداة" self.category = "تجميع هذه الأداة"

OutRas = كثافة النواة (InPts ، بلا ، 30)

تنتج القيم الأكبر لمعلمة نصف قطر البحث خطوطًا نقطية أكثر سلاسة وعمومية للكثافة. تنتج القيم الأصغر خطوطًا نقطية تُظهر مزيدًا من التفاصيل.

يتم أخذ نقاط أو أجزاء الخط التي تقع داخل الحي فقط في الاعتبار عند حساب الكثافة. إذا لم تكن هناك نقاط أو أقسام خطية تقع داخل المنطقة المجاورة لخلية معينة ، فسيتم تعيين NoData لتلك الخلية.

إذا كانت وحدات عامل مقياس وحدة المساحة صغيرة بالنسبة إلى الميزات (المسافة بين النقاط أو طول أقسام الخط ، اعتمادًا على نوع الميزة) ، فقد تكون قيم الإخراج صغيرة. للحصول على قيم أكبر ، حدد عامل مقياس وحدة المساحة للوحدات الأكبر (على سبيل المثال ، كيلومتر مربع مقابل متر مربع).

بالنسبة لـ ArcGIS 10.2.1 والإصدارات الأحدث ، يتم حساب نصف قطر البحث الافتراضي (عرض النطاق الترددي) بناءً على التكوين المكاني وعدد نقاط الإدخال. يصحح هذا الأسلوب القيم المتطرفة المكانية - نقاط الإدخال البعيدة جدًا عن البقية - بحيث لا تجعل نصف قطر البحث كبيرًا بشكل غير معقول.

يمكن أن تعطي القيم الكبيرة جدًا أو الصغيرة جدًا في حقل السكان نتائج قد تبدو غير بديهية. إذا كان متوسط ​​حقل السكان أكبر بكثير من 1 (على سبيل المثال ، كما هو الحال مع سكان المدينة) ، فقد يكون نصف قطر البحث الافتراضي صغيرًا جدًا ، مما ينتج عنه حلقات صغيرة حول نقاط الإدخال. إذا كان متوسط ​​حقل السكان أصغر بكثير من 1 ، فقد يبدو عرض النطاق الترددي المحسوب كبيرًا بشكل غير معقول. في هذه الحالات ، قد ترغب في إدخال نطاق البحث الخاص بك.

تعتمد حسابات الكثافة على حسابات دقيقة للمسافة والمساحة. يوصى باستخدام الطريقة الجيوديسية في معظم الحالات. قد تكون طريقة PLANAR مناسبة إذا كان التحليل سيتم إجراؤه على منطقة محلية مع إسقاط يحافظ بدقة على المسافة والمساحة الصحيحة. راجع التعرف على المزيد حول أنظمة الإحداثيات الجغرافية والمتوقعة لتحديد الإسقاطات المناسبة.

راجع بيئات التحليل والمحلل المكاني للحصول على تفاصيل إضافية حول بيئات المعالجة الجغرافية التي تنطبق على هذه الأداة.


تعرف على كيفية استخدام أدوات ArcMap والنماذج والبرامج النصية في ArcGIS Pro

يمكنك إضافة اتصالات إلى المجلدات وقواعد البيانات والخوادم ومحددات المواقع ومربعات الأدوات والأنماط والعناصر الأخرى إلى مشروعك من إدراج علامة التبويب على الشريط.

في ال المفضلة المجموعة ، انقر فوق اضافة عنصر لإضافة عنصر إلى المشروع الحالي وتسهيل الوصول إليه في المشاريع الأخرى. يمكن إضافة المفضلة على الفور إلى أي مشروع من علامة التبويب "المفضلة" في فهرس جزء أو من عرض الكتالوج.

يمكنك أيضًا جعل عنصرًا مفضلاً عن طريق النقر بزر الماوس الأيمن فوق العنصر في ملف فهرس جزء أو عرض الكتالوج والاختيار اضافة الى المفضلة .

يمكن استخدام أدوات ونماذج وبرامج ArcMap في ArcGIS Pro ولكن قد يلزم تعديلها. قم بتشغيل أداة المعالجة الجغرافية Analyze Tools For Pro للتحقق من توافق البرنامج النصي أو صندوق الأدوات.

يستخدم ArcGIS Pro Python 3 ، لذا يجب تعديل البرامج النصية التي يتم تشغيلها في ArcMap. لمزيد من المعلومات ، راجع ترحيل Python من 10.x إلى ArcGIS Pro والترحيل من arcpy.mapping إلى ArcGIS Pro. لن يتم تشغيل الوظائف الإضافية .NET على مستوى التطبيق المكتوبة لـ ArcMap في ArcGIS Pro.

خدمة ميزات الويب (WFS) هي مواصفات مفتوحة لخدمة الميزات الجغرافية عبر الويب. بخلاف خدمة خريطة الويب (WMS) ، تقوم خدمة WFS بإرجاع الميزات الفعلية مع الهندسة والسمات. يمكنك الاتصال بخدمة WFS Open Geospatial Consortium (OGC) في ArcMap أو ArcGIS Pro عن طريق إنشاء اتصال خدمة WFS أو إضافة عنصر WFS من البوابة الإلكترونية النشطة.

ArcMap (الإصدار 10.8 ، راجع ارتباط الإصدارات السابقة)

قبل استخدام خدمات ميزات الويب في ArcMap ، يكون ملف إمكانية التشغيل البيني للبيانات يجب تثبيت التمديد.

يتم تقديم ملحق Data Interoperability لـ ArcGIS Desktop على مستويين من الترخيص:

  • يمنحك تثبيت إمكانية التشغيل البيني للبيانات وصولاً فوريًا إلى مجموعات بيانات WFS و GML-SF (ميزات بسيطة). يمكنك إنشاء اتصالات التشغيل البيني لبيانات WFS و GML-SF وإضافتها إلى الخرائط واستخدامها مع أدوات المعالجة الجغرافية. يمكنك أيضًا استخدام أدوات التحويل في مربع أدوات Data Interoperability لقراءة خدمات WFS وقراءة مجموعات بيانات GML-SF وكتابتها.
  • يضيف اعتماد إمكانية التشغيل البيني للبيانات بترخيص صالح وتمكينه في تطبيق ArcGIS Desktop دعمًا إضافيًا خارج الصندوق لأكثر من 100 تنسيق GIS و CAD والنقطية وقاعدة البيانات ، ويمنحك الوصول إلى تطبيق FME Workbench.

يمكن تثبيت الامتداد عن طريق تشغيل ملف setup.exe ، الموجود في المجلد المسمى بالمثل والمتوفر مع وسائط تثبيت ArcGIS. بعد ذلك ، يجب أن يتم تخويل الامتداد بترخيص صالح يختلف سير العمل قليلاً إذا كان يعمل باستخدام تثبيت للاستخدام الفردي أو تثبيت الاستخدام المتزامن. ويمكن الاطلاع على مزيد من المعلومات هنا.

بمجرد تثبيت الامتداد ، يمكنك إنشاء ارتباط بخدمة WFS من خلال الكتالوج ، عن طريق إضافة ملف اتصال التشغيل البيني. بعد ذلك ، أضف الخدمة إلى خريطتك بواسطة ملف إضافة البيانات نافذة الحوار أو عن طريق السحب والإفلات البسيط من نافذة الكتالوج.

يمكن العثور على وثائق التشغيل البيني عبر الإنترنت هنا و:

في ال فهرس نافذة ، قم بتوسيع مجلد اتصالات التشغيل التفاعلي.

نقرتين متتاليتين إضافة اتصال إمكانية التشغيل البيني.

انقر على شكل تصفح زر (علامة القطع) لفتح معرض قارئ FME.

أختر WFS (خدمة ميزات الويب) وانقر حسنا.

اكتب عنوان URL في ملف مجموعة البيانات مربع الكتابة.

للحصول على سير عمل أكثر تفصيلاً ، يرجى الرجوع إلى إضافة خدمة WFS إلى وثائق ArcMap.

يمكن إضافة اتصال بالانتقال إلى علامة التبويب إدراج ، ضمن مجموعة المشروع ، ثم النقر فوق القائمة المنسدلة للاتصالات ، ثم تحديد خادم WFS جديد في النهاية. يمكنك بعد ذلك كتابة عنوان URL لموقع خادم WFS الذي تريد توصيله داخل مربع نص عنوان URL للخادم. يختلف عنوان URL اعتمادًا على تكوين الموقع ولكنه عادةً ما يبدو كالتالي: http://sampleserver6.arcgisonline.com/arcgis/services/SampleWorldCities/MapServer/WFSServer

يجب عليك بعد ذلك تحديد إصدار WFS الذي تريد الاتصال به وتعيين اتصالك. يمكن العثور على إعدادات إضافية هنا.


ميراث:

تم تحسين الخوارزمية الموجودة في أداة تحليل التجميع وتمت إضافة وظائف جديدة إلى هذه الطرق في ArcGIS Pro 2.1. لتبسيط الميزات والأساليب الجديدة ، تم إنشاء أداتين جديدتين لتحل محل أداة تحليل التجميع. استخدم أداة التجميع متعدد المتغيرات المقيدة مكانيًا إذا كنت ترغب في إنشاء مجموعات متجاورة مكانيًا. استخدم أداة التجميع متعدد المتغيرات لإنشاء مجموعات بدون قيود مكانية.

تنتج هذه الأداة فئة معلم الإخراج مع الحقول المستخدمة في التحليل بالإضافة إلى حقل عدد صحيح جديد يسمى SS_GROUP. يعتمد العرض الافتراضي على حقل SS_GROUP ويظهر لك المجموعة التي تقع فيها كل ميزة. إذا أشرت إلى أنك تريد ثلاث مجموعات ، على سبيل المثال ، سيحتوي كل سجل على 1 أو 2 أو 3 للحقل SS_GROUP. عند عدم تحديد أي قيد مكاني لمعلمة القيود المكانية ، ستحتوي فئة ميزة الإخراج أيضًا على حقل ثنائي جديد يسمى SS_SEED. يشير حقل SS_SEED إلى الميزات التي تم استخدامها كنقاط بداية لتوسيع المجموعات. سيتطابق عدد القيم غير الصفرية في الحقل SS_SEED مع القيمة التي أدخلتها لمعلمة عدد المجموعات.

ستنشئ هذه الأداة ملف تقرير PDF اختياريًا عندما تحدد مسارًا لمعلمة Output Report File. يحتوي هذا التقرير على مجموعة متنوعة من الجداول والرسوم البيانية لمساعدتك على فهم خصائص المجموعات المحددة. سيتم تضمين المسار إلى تقرير PDF مع الرسائل التي تلخص معاملات تنفيذ الأداة. سيؤدي النقر فوق هذا المسار إلى فتح ملف التقرير. يمكنك الوصول إلى الرسائل بالمرور فوق شريط التقدم ، أو النقر فوق الزر المنبثق ، أو توسيع قسم الرسائل في جزء المعالجة الجغرافية. يمكنك أيضًا الوصول إلى الرسائل الخاصة بتشغيل سابق من تحليل التجميع عبر محفوظات المعالجة الجغرافية.

يمكن أن يؤدي إنشاء ملف التقرير إلى إضافة وقت معالجة كبير. وبالتالي ، بينما سينشئ تحليل التجميع فئة ميزات الإخراج التي تعرض عضوية المجموعة ، فلن يتم إنشاء ملف تقرير PDF إذا حددت أكثر من 15 مجموعة أو أكثر من 15 متغيرًا.

عندما لا يتم عرض فئة ميزات الإدخال (أي عندما يتم إعطاء الإحداثيات بالدرجات والدقائق والثواني) أو عندما يتم تعيين نظام إحداثيات الإخراج على نظام الإحداثيات الجغرافية ، يتم حساب المسافات باستخدام القياسات الوترية. تُستخدم قياسات المسافة الوترية لأنه يمكن حسابها بسرعة وتوفر تقديرات جيدة جدًا للمسافات الجيوديسية الحقيقية ، على الأقل للنقاط الواقعة ضمن حوالي ثلاثين درجة من بعضها البعض. تستند المسافات الوترية على شكل كروي مفلطح. بالنظر إلى أي نقطتين على سطح الأرض ، فإن المسافة الوترية بينهما هي طول الخط الذي يمر عبر الأرض ثلاثية الأبعاد لربط هاتين النقطتين. يتم الإبلاغ عن المسافات الوترية بالمتر.

حذر:

تأكد من عرض بياناتك إذا كانت منطقة الدراسة الخاصة بك تتجاوز 30 درجة. المسافات الوترية ليست تقديرًا جيدًا للمسافات الجيوديسية التي تتجاوز 30 درجة.

يوفر لك حقل المعرف الفريد طريقة لربط السجلات في فئة ميزة الإخراج بالبيانات الموجودة في فئة ميزة الإدخال الأصلية. وبالتالي ، يجب أن تكون قيم حقل المعرف الفريد فريدة لكل ميزة ويجب أن تكون عادةً حقلاً دائمًا يظل مع فئة المعلم. إذا لم يكن لديك "حقل معرف فريد" في مجموعة البيانات الخاصة بك ، فيمكنك بسهولة إنشاء واحد عن طريق إضافة حقل عدد صحيح جديد إلى جدول فئة المعلم الخاص بك وحساب قيم الحقل لتكون مساوية لحقل FID / OID. لا يمكنك استخدام حقل FID / OID مباشرة لمعلمة حقل المعرف الفريد.

يجب أن تكون حقول التحليل رقمية ويجب أن تحتوي على مجموعة متنوعة من القيم. سيتم إسقاط الحقول التي لا تحتوي على اختلاف (أي نفس القيمة لكل سجل) من التحليل ولكن سيتم تضمينها في فئة ميزات الإخراج. يمكن استخدام الحقول الفئوية مع أداة تحليل التجميع إذا تم تمثيلها كمتغيرات وهمية (قيمة واحد لجميع المعالم في فئة وأصفار لجميع الميزات الأخرى).

ستنشئ أداة تحليل التجميع مجموعات مع قيود المساحة أو الوقت أو بدونها. بالنسبة لبعض التطبيقات ، قد لا ترغب في فرض متطلبات الاتصال أو التقارب الأخرى على المجموعات التي تم إنشاؤها. في هذه الحالات ، ستقوم بتعيين معلمة القيود المكانية على بلا قيد مكاني.

بالنسبة لبعض التحليلات ، ستحتاج إلى أن تكون المجموعات متجاورة مكانيًا. يتم تمكين خيارات الاتصال لفئات معالم المضلع وتشير إلى أن الميزات يمكن أن تكون جزءًا فقط من نفس المجموعة إذا كانت تشترك في حافة (حواف كونتيجويتي فقط) أو إذا كانت تشترك إما في حافة أو قمة (زوايا حواف كونتيجويتي) مع عضو آخر مجموعة.

تعد خيارات Delaunay Triangulation و K الأقرب للجيران مناسبة لميزات النقطة أو المضلع عندما تريد التأكد من أن جميع أعضاء المجموعة قريبون. تشير هذه الخيارات إلى أنه سيتم تضمين الميزة في مجموعة فقط إذا كانت هناك ميزة أخرى على الأقل هي الجار الطبيعي (Delaunay triangulation) أو K الأقرب. K هو عدد الجيران الذي يجب مراعاته ويتم تحديده باستخدام معلمة عدد الجيران.

من أجل إنشاء مجموعات ذات قيود المكان والزمان ، استخدم أداة Generate Spatial Weights Matrix لإنشاء ملف مصفوفة أوزان مكانية (.swm) يحدد العلاقات بين الزمان والمكان بين ميزاتك. بعد ذلك ، قم بتشغيل تحليل التجميع ، واضبط معلمة القيود المكانية للحصول على أوزان مكانية من الملف ومعلمة ملف مصفوفة الأوزان المكانية إلى ملف SWM الذي قمت بإنشائه.

من أجل إنشاء مجموعات ثلاثية الأبعاد تأخذ في الاعتبار قيم z لميزاتك ، استخدم أداة Generate Spatial Weights Matrix مع استخدام معلمة قيم Z المحددة لإنشاء ملف مصفوفة للأوزان المكانية (swm.) لتعريف ثلاثي الأبعاد العلاقات بين ميزاتك. بعد ذلك ، قم بتشغيل تحليل التجميع ، واضبط معلمة القيود المكانية للحصول على أوزان مكانية من الملف ومعلمة ملف مصفوفة الأوزان المكانية إلى ملف SWM الذي قمت بإنشائه.

قد يتم فرض قيود مكانية إضافية ، مثل المسافة الثابتة ، باستخدام أداة Generate Spatial Weights Matrix لإنشاء ملف SWM أولاً ثم توفير المسار إلى هذا الملف لمعلمة Spatial Weights Matrix File.

على الرغم من أنه يمكنك إنشاء ملف مصفوفة أوزان مكانية (SWM) لتحديد القيود المكانية ، لا يوجد ترجيح فعلي يتم تطبيقه. يحدد SWM الميزات المتجاورة أو القريبة. يحدد فرض القيد المكاني من يمكنه ومن لا يمكن أن يكون أعضاء في نفس المجموعة. إذا قمت بتحديد حواف كونتيجويتي فقط ، على سبيل المثال ، فإن جميع الميزات في مجموعة واحدة سيكون لها على الأقل حافة واحدة مشتركة مع ميزة أخرى في المجموعة. هذا يحافظ على المجموعات الناتجة متجاورة مكانيًا.

يضمن تحديد القيد المكاني وجود مجموعات مضغوطة أو متجاورة أو قريبة. يمكن أن يؤدي تضمين المتغيرات المكانية في قائمة حقول التحليل أيضًا إلى تشجيع سمات المجموعة هذه. من أمثلة المتغيرات المكانية المسافة إلى منحدرات الطرق السريعة ، وإمكانية الوصول إلى فرص العمل ، والقرب من فرص التسوق ، ومقاييس الاتصال ، وحتى الإحداثيات (X ، Y). يمكن أن يشجع تضمين المتغيرات التي تمثل الوقت أو اليوم من الأسبوع أو المسافة الزمنية على الاكتناز الزمني بين أعضاء المجموعة.

عندما يكون هناك نمط مكاني مميز لميزاتك (مثال على ذلك سيكون ثلاث مجموعات منفصلة ومتميزة مكانيًا) ، يمكن أن يعقد خوارزمية التجميع المقيدة مكانيًا. وبالتالي ، تحدد خوارزمية التجميع أولاً ما إذا كانت هناك أي مجموعات غير متصلة. إذا كان عدد المجموعات غير المتصلة أكبر من عدد المجموعات المحدد ، فلن تتمكن الأداة من حلها وستفشل مع ظهور رسالة خطأ مناسبة. إذا كان عدد المجموعات غير المتصلة مطابقًا تمامًا لعدد المجموعات المحدد ، فإن التكوين المكاني للميزات وحده يحدد نتائج المجموعة ، كما هو موضح في (أ) أدناه. إذا كان عدد المجموعات المحدد أكبر من عدد المجموعات غير المتصلة ، يبدأ التجميع مع تحديد المجموعات غير المتصلة بالفعل. على سبيل المثال ، إذا كانت هناك ثلاث مجموعات غير متصلة وعدد المجموعات المحدد هو 4 ، فسيتم تقسيم إحدى المجموعات الثلاث لإنشاء مجموعة رابعة ، كما هو موضح في (ب) أدناه.

في بعض الحالات ، لن تتمكن أداة تحليل التجميع من تلبية القيود المكانية المفروضة ، ولن يتم تضمين بعض الميزات في أي مجموعة (ستكون قيمة SS_GROUP هي -9999 مع عرض مجوف). يحدث هذا إذا كانت هناك ميزات بدون جيران. لتجنب ذلك ، استخدم K أقرب جيران ، مما يضمن وجود جيران لكل الميزات. ستساعد زيادة معلمة عدد الجيران في حل المشكلات المتعلقة بالمجموعات غير المتصلة.

في حين أن هناك ميلًا إلى الرغبة في تضمين أكبر عدد ممكن من حقول التحليل ، إلا أنه من الأفضل بالنسبة لهذه الأداة البدء بمتغير واحد والبناء. النتائج أسهل بكثير في التفسير مع عدد أقل من حقول التحليل. كما أنه من الأسهل تحديد المتغيرات التي تعتبر أفضل مُميِّزات عندما يكون هناك عدد أقل من الحقول.

عند تحديد لا قيود مكانية لمعلمة القيود المكانية ، يكون لديك ثلاثة خيارات لطريقة التهيئة: البحث عن مواقع البذور ، والحصول على البذور من الحقل ، واستخدام البذور العشوائية. البذور هي السمات المستخدمة لتنمية المجموعات الفردية. على سبيل المثال ، إذا قمت بإدخال 3 لمعلمة عدد المجموعات ، فسيبدأ التحليل بثلاث ميزات أولية. يقوم الخيار الافتراضي ، البحث عن مواقع البذور ، بتحديد البذرة الأولى عشوائيًا والتأكد من أن البذور التالية المحددة تمثل ميزات بعيدة عن بعضها البعض في مساحة البيانات. يؤدي اختيار البذور الأولية التي تلتقط مناطق مختلفة من مساحة البيانات إلى تحسين الأداء. في بعض الأحيان تعلم أن ميزات معينة تعكس خصائص مميزة تريد أن تمثلها مجموعات مختلفة. في هذه الحالة ، قم بإنشاء حقل أولي لتحديد تلك السمات المميزة. يجب أن يحتوي الحقل الأولي الذي تقوم بإنشائه على أصفار للجميع باستثناء السمات الأولية الأولية ، يجب أن يكون للميزات الأولية الأولية قيمة 1. ستختار بعد ذلك الحصول على البذور من الحقل لمعلمة طريقة التهيئة. إذا كنت مهتمًا بإجراء نوع من تحليل الحساسية لمعرفة الميزات التي توجد دائمًا في نفس المجموعة ، فيمكنك تحديد خيار استخدام بذور عشوائية لمعلمة طريقة التهيئة. بالنسبة لهذا الخيار ، يتم تحديد جميع الميزات الأولية بشكل عشوائي.

عند استخدام بذور عشوائية ، قد ترغب في اختيار بذرة لبدء مولد الأرقام العشوائية من خلال إعداد بيئة مولد الأرقام العشوائية. ومع ذلك ، فإن مولد الأرقام العشوائي الذي تستخدمه هذه الأداة هو دائمًا Mersenne Twister.

سيتم تفسير أي قيم من 1 في حقل التهيئة على أنها أولية. إذا كان هناك ميزات أولية أكثر من عدد المجموعات ، فسيتم اختيار الميزات الأولية عشوائيًا من تلك التي تم تحديدها بواسطة حقل التهيئة. إذا كان هناك ميزات أولية أقل مما هو محدد بواسطة عدد المجموعات ، فسيتم تحديد الميزات الأولية الإضافية بحيث تكون بعيدة (في مساحة البيانات) عن تلك التي تم تحديدها بواسطة حقل التهيئة.

في بعض الأحيان تعرف عدد المجموعات الأكثر ملاءمة لبياناتك. ومع ذلك ، في حالة عدم قيامك بذلك ، قد تضطر إلى تجربة أعداد مختلفة من المجموعات ، مع ملاحظة القيم التي توفر أفضل تمايز للمجموعة. عندما تتحقق من معلمة تقييم العدد الأمثل للمجموعات ، سيتم حساب إحصاء F الزائف لتجميع الحلول مع 2 إلى 15 مجموعة. إذا لم تكن هناك معايير أخرى ترشدك في اختيارك لعدد المجموعات ، فاستخدم رقمًا مرتبطًا بواحدة من أكبر قيم إحصائية F الزائفة. تشير أكبر قيم إحصائية F إلى الحلول الأفضل أداءً في تعظيم أوجه التشابه داخل المجموعة والاختلافات بين المجموعة. عندما تحدد ملف تقرير إخراج اختياري ، فإن تقرير PDF هذا سيتضمن رسمًا بيانيًا يوضح القيم الإحصائية F للحلول ذات 2 إلى 15 مجموعة.

بغض النظر عن عدد المجموعات التي تحددها ، ستتوقف الأداة إذا أصبح التقسيم إلى مجموعات إضافية عشوائيًا. افترض ، على سبيل المثال ، أن بياناتك تتكون من ثلاثة مضلعات مكانية العنقودية وحقل تحليل واحد. إذا كانت جميع الميزات في نظام مجموعة لها نفس قيمة حقل التحليل ، فسيصبح الأمر عشوائيًا في كيفية تقسيم أي مجموعة من المجموعات الفردية بعد إنشاء ثلاث مجموعات. إذا حددت أكثر من ثلاث مجموعات في هذه الحالة ، فستظل الأداة تنشئ ثلاث مجموعات فقط. طالما أن أحد حقول التحليل على الأقل في مجموعة يحتوي على بعض الاختلافات في القيم ، يمكن أن يستمر التقسيم إلى مجموعات إضافية. لن يتم تقسيم المجموعات بشكل أكبر إذا لم يكن هناك اختلاف في قيم حقل التحليل.

عندما تقوم بتضمين قيد مكاني أو مكاني في تحليلك ، فإن إحصائيات F الزائفة تكون قابلة للمقارنة (طالما أن ميزات الإدخال وحقول التحليل لا تتغير). وبالتالي ، يمكنك استخدام قيم F-Statistic ليس فقط لتحديد العدد الأمثل للمجموعات ولكن أيضًا لمساعدتك على اتخاذ خيارات حول خيار القيود المكانية الأكثر فعالية وطريقة المسافة وعدد الجيران.

تستخدم خوارزمية K-Means لتقسيم الميزات إلى مجموعات عندما لا يتم تحديد أي قيود مكانية لمعلمة القيود المكانية والعثور على مواقع البذور أو استخدام بذور عشوائية لأسلوب التهيئة يتضمن الاستدلال وقد يعرض نتيجة مختلفة في كل مرة تقوم فيها بتشغيل الأداة (حتى باستخدام نفس البيانات ونفس معلمات الأداة). هذا لأن هناك مكونًا عشوائيًا للعثور على ميزات البذور الأولية المستخدمة لتنمية المجموعات.

عند فرض قيد مكاني ، لا يوجد مكون عشوائي للخوارزمية ، لذلك يمكن حساب إحصائية F زائفة واحدة للمجموعات من 2 إلى 15 ، ويمكن استخدام أعلى قيم F الإحصائية لتحديد العدد الأمثل للمجموعات لـ تحليلك. نظرًا لأن خيار عدم وجود قيود مكانية هو حل إرشادي ، ومع ذلك ، فإن تحديد العدد الأمثل للمجموعات يكون أكثر انخراطًا. قد يختلف F-Statistic في كل مرة يتم فيها تشغيل الأداة ، بسبب الميزات الأولية المختلفة. عندما يوجد نمط مميز في بياناتك ، فإن الحلول من تشغيل إلى آخر ستكون أكثر اتساقًا. وبالتالي ، للمساعدة في تحديد العدد الأمثل للمجموعات عند تحديد خيار عدم وجود قيود مكانية ، تقوم الأداة بحل تحليل التجميع 10 مرات لـ 2 و 3 و 4 وحتى 15 مجموعة. يتم بعد ذلك الإبلاغ عن معلومات حول توزيع هذه الحلول العشرة (الحد الأدنى ، والحد الأقصى ، والمتوسط ​​، والمتوسط) لمساعدتك في تحديد العدد الأمثل للمجموعات لتحليلك.

تُرجع أداة تحليل التجميع ثلاث قيم مخرجات مشتقة للاستخدام المحتمل في النماذج والبرامج النصية المخصصة. هذه هي إحصائية F الزائفة لعدد المجموعات (Output_FStat) ، وهي أكبر إحصائية زائفة F للمجموعات من 2 إلى 15 (Max_FStat) ، وعدد المجموعات المرتبطة بأكبر قيمة إحصائية زائفة F (Max_FStat_Group). عندما لا تختار "تقييم العدد الأمثل للمجموعات" ، يتم تعيين كافة متغيرات الإخراج المشتقة إلى بلا.

قد يتغير رقم المجموعة المخصص لمجموعة من الميزات من تشغيل إلى آخر. على سبيل المثال ، افترض أنك قسمت الميزات إلى مجموعتين بناءً على متغير الدخل. في المرة الأولى التي تقوم فيها بتشغيل التحليل ، قد ترى ميزات الدخل المرتفع مصنفة على أنها المجموعة 2 وميزات الدخل المنخفض المصنفة على أنها المجموعة 1 في المرة الثانية التي تقوم فيها بإجراء نفس التحليل ، قد يتم تصنيف ميزات الدخل المرتفع على أنها المجموعة 1. يمكنك أيضًا لاحظ أن بعض ميزات الدخل المتوسط ​​تقوم بتبديل عضوية المجموعة من تشغيل إلى آخر عندما لا يتم تحديد قيود مكانية.

بينما يمكنك تحديد إنشاء عدد كبير جدًا من المجموعات المختلفة ، فمن المحتمل في معظم السيناريوهات تقسيم الميزات إلى مجموعات قليلة فقط. نظرًا لصعوبة تفسير الرسوم البيانية والخرائط في العديد من المجموعات ، لا يتم إنشاء أي تقرير عند إدخال قيمة أكبر من 15 لمعلمة عدد المجموعات أو تحديد أكثر من 15 حقلاً من حقول التحليل. ومع ذلك ، يمكنك زيادة هذا القيد على الحد الأقصى لعدد المجموعات.

الغوص في:

نظرًا لأن لديك شفرة مصدر Python لأداة تحليل التجميع ، يمكنك تجاوز قيود تقرير 15 متغيرًا أو 15 مجموعة ، إذا رغبت في ذلك. يتم تعيين هذا الحد الأعلى بواسطة متغيرين في كل من ملف البرنامج النصي Partition.py ورمز التحقق من صحة الأداة داخل Spatial Statistics Toolbox:

لمزيد من المعلومات حول ملف تقرير الإخراج ، راجع معرفة المزيد حول كيفية عمل تحليل التجميع.


من حين لآخر ، ستنشأ الحاجة إلى أن تقبل المعلمة أنواع بيانات متعددة ، وغالبًا ما يشار إليها على أنها نوع بيانات مركب. في مربع أدوات Python ، يتم تحديد أنواع البيانات المركبة عن طريق تعيين قائمة أنواع البيانات لخاصية نوع بيانات المعلمة. في المثال أدناه ، يتم تحديد معلمة تقبل إما مجموعة البيانات النقطية أو كتالوج البيانات النقطية.

تم تقديم استخدام الكلمات الأساسية لأنواع بيانات المعلمات في حزمة الخدمة 10.1 1. لا يزال من الممكن استخدام أوصاف المعلمات ولكنها غير مترجمة ولا يمكن استخدامها في أماكن مختلفة.

مجموعة بيانات ، تُستخدم للترميز الجغرافي ، تخزن سمات العنوان ، والفهارس المرتبطة ، والقواعد التي تحدد عملية ترجمة الأوصاف غير المكانية للأماكن إلى بيانات مكانية.

قالب يتم بناء عليه محدد موقع العنوان الجديد.

حجم الخلية المستخدمة بواسطة أدوات البيانات النقطية.

نوع بيانات يقبل أي قيمة.

ملف يحتوي على خريطة واحدة وتخطيطها والطبقات والجداول والمخططات والتقارير المرتبطة بها.

نوع وحدة المساحة وقيمتها مثل المتر المربع أو الفدان.

مصدر بيانات متجه مع مزيج من أنواع المعالم مع الترميز. لا يمكن استخدام مجموعة البيانات للاستعلامات أو التحليلات المستندة إلى فئة الميزات.

عقدة المستوى الأعلى في شجرة الكتالوج.

حجم الخلية المستخدم بواسطة ملحق ArcGIS Spatial Analyst.

تحدد جانبي الخلية النقطية.

مرجع لطبقات الأطفال المتعددة ، بما في ذلك الترميز وخصائص العرض.

يحدد نوع الضغط المستخدم للنقطية.

إطار مرجعي - مثل نظام UTM - يتكون من مجموعة من النقاط ، والخطوط ، و / أو الأسطح ، ومجموعة من القواعد ، تُستخدم لتحديد مواضع النقاط في فضاء ثنائي وثلاثي الأبعاد.

تنسيق مجلد الأنظمة

مجلد على القرص يخزن أنظمة إحداثيات.

مجموعة بيانات التغطية ، ونموذج بيانات خاص لتخزين المعالم الجغرافية كنقاط وأقواس ومضلعات مع جداول سمات المعالم المرتبطة.

فئة معالم التغطية ، مثل النقطة والقوس والعقدة والمسار ونظام المسار والقسم والمضلع والمنطقة.

مجموعة بيانات مرئية في ArcCatalog.

مجلد اتصال قاعدة البيانات في ArcCatalog.

مجموعة من البيانات ذات الصلة ، وعادة ما يتم تجميعها أو تخزينها معًا.

تم تخزين بيانات السمات بتنسيق dBASE.

يحدد مجموعة فرعية من عقد رقم تعريف دافع الضرائب (TIN) لإنشاء نسخة عامة من رقم التعريف الضريبي (TIN).

مسار وصول إلى جهاز تخزين البيانات.

سيتم تخزين أي رقم فاصلة عائمة كقيمة 64 بت ذات دقة مزدوجة.

سلسلة مشفرة لكلمات المرور.

أزواج الإحداثيات التي تحدد الحد الأدنى لمستطيل الإحاطة الذي يقع فيه مصدر البيانات.

نطاق قيمة المقياس وقيمة الزيادة المطبقة على المدخلات في عملية التراكب الموزون.

يحدد أزواج الإحداثيات التي تحدد الحد الأدنى للمستطيل المحيط (xmin و ymin و xmax و ymax) لمصدر البيانات. تقع جميع إحداثيات مصدر البيانات ضمن هذه الحدود.

معلمة استخراج القيم.

مجموعة من البيانات المكانية بنفس نوع الشكل: نقطة ، ونقاط متعددة ، وخطوط متعددة ، ومضلع.

مجموعة من فئات المعالم التي تشترك في منطقة جغرافية مشتركة ونفس نظام الإسناد المكاني.

مرجع إلى فئة المعلم ، بما في ذلك الترميز وخصائص العرض.

ترسم الميزات التفاعلية الميزات عند تشغيل الأداة.

عمود في جدول يخزن قيم سمة واحدة.

تفاصيل حول حقل في خريطة المجال.

مجموعة من الحقول في جدول إدخال واحد أو أكثر.

يحدد موقعًا على القرص حيث يتم تخزين البيانات.

سطح نقطي يتم تمثيل قيم خليته بصيغة أو ثابت.

مجموعة بيانات ذات موضوع مشترك في قاعدة بيانات جغرافية.

كائن خشن يشير إلى قاعدة بيانات جغرافية.

شبكة خطية ممثلة بميزات الحافة والتقاطع الطوبولوجي. يعتمد اتصال الميزات على صدفتهم الهندسية.

مرجع إلى مصدر بيانات جيوإحصائي ، بما في ذلك الترميز وخصائص العرض.

حي البحث الجغرافي الإحصائي

يحدد معلمات جوار البحث لطبقة جيوإحصائية.

جدول القيمة الجيوإحصائية

مجموعة من مصادر البيانات والحقول التي تحدد طبقة إحصائية جغرافية.

مجموعة من الطبقات تظهر وتعمل كطبقة واحدة. تعمل طبقات المجموعة على تسهيل تنظيم الخريطة وتعيين خيارات ترتيب الرسم المتقدمة ومشاركة الطبقات لاستخدامها في خرائط أخرى.

العلاقة بين عامل التكلفة الأفقي وزاوية الحركة النسبية الأفقية.

بنية بيانات تُستخدم لتسريع البحث عن السجلات في قواعد البيانات وقواعد البيانات الجغرافية.

صيغة لتعريف ومعالجة البيانات في جدول INFO.

جدول في قاعدة بيانات INFO.

تخزن مجموعة بيانات LAS مرجعًا لملف LAS واحد أو أكثر على القرص ، بالإضافة إلى ميزات السطح الإضافية. ملف LAS هو ملف ثنائي مصمم لتخزين بيانات ليدار المحمولة جواً.

طبقة تشير إلى مجموعة بيانات LAS على القرص. يمكن لهذه الطبقة تطبيق المرشحات على ملفات lidar وقيود السطح المشار إليها بواسطة مجموعة بيانات LAS.

مرجع إلى مصدر بيانات ، مثل ملف الشكل أو التغطية أو فئة معلم قاعدة البيانات الجغرافية أو البيانات النقطية ، بما في ذلك خصائص الترميز والتقديم.

ملف بملحق .lyr يخزن تعريف الطبقة ، بما في ذلك الترميز وخصائص العرض.

شكل ، مستقيم أو منحني ، محدد بسلسلة متصلة من أزواج إحداثيات x و y الفريدة.

نوع وحدة خطية وقيمتها مثل المتر أو الأقدام.

نطاق من أدنى وأعلى قيمة ممكنة للإحداثيات m.

مجموعة من البيانات النقطية والصورة تتيح لك تخزين البيانات وعرضها والاستعلام عنها. إنه نموذج بيانات داخل قاعدة البيانات الجغرافية المستخدمة لإدارة مجموعة من مجموعات البيانات النقطية (الصور) المخزنة ككتالوج ويتم عرضها كصورة موزعة.

طبقة تشير إلى مجموعة بيانات فسيفساء.

شكل المنطقة حول كل خلية يستخدم لحساب الإحصائيات.

خريطة ميدانية لفئة محلل الشبكة

التعيين بين خصائص الموقع في طبقة محلل الشبكة (مثل نقاط التوقف والمرافق والحوادث) وفئة معلم النقطة.

إعدادات التسلسل الهرمي لمحلل الشبكة

سمة التدرج الهرمي التي تقسم قيم التدرج الهرمي لمجموعة بيانات الشبكة إلى ثلاث مجموعات باستخدام عددين صحيحين. العدد الصحيح الأول ، high_rank_ends ، يحدد القيمة النهائية للمجموعة الأولى ، والرقم الثاني ، low_rank_begin ، يحدد القيمة الأولية للمجموعة الثالثة.

طبقة مجموعة خاصة تستخدم للتعبير عن مشاكل توجيه الشبكة وحلها. تمثل كل طبقة فرعية محفوظة في الذاكرة في طبقة محلل الشبكة بعض جوانب مشكلة التوجيه وحل التوجيه.

مجموعة من عناصر الشبكة المتصلة طوبولوجيًا (الحواف والوصلات والمنعطفات) ، والمشتقة من مصادر الشبكة والمرتبطة بمجموعة من سمات الشبكة.

مرجع إلى مجموعة بيانات شبكة ، بما في ذلك خصائص الترميز والعرض.

نسيج الطرود عبارة عن مجموعة بيانات لتخزين وصيانة وتحرير السطح المستمر للطرود المتصلة أو شبكة الطرود.

طبقة تشير إلى قطعة قماش على القرص. تعمل هذه الطبقة كطبقة مجموعة تنظم مجموعة من الطبقات ذات الصلة تحت طبقة واحدة.

تسلسل متصل من أزواج إحداثيات x و y حيث يكون زوج الإحداثيات الأول والأخير متماثلين.

ملف يخزن معلومات النظام الإحداثي للبيانات المكانية.

يحدد ما إذا كان سيتم بناء الأهرامات.

يحدد النقاط المحيطة التي سيتم استخدامها في الاستيفاء.

يحدد البذرة والمولد لاستخدامهما عند إنشاء قيم عشوائية.

طبقة في مجموعة بيانات نقطية.

تعبير الآلة الحاسبة النقطية

تعبير الآلة الحاسبة النقطية.

مجموعة من مجموعات البيانات النقطية المحددة في جدول يحدد كل سجل جدول مجموعة بيانات نقطية فردية في الكتالوج.

مرجع إلى كتالوج البيانات النقطية ، بما في ذلك خصائص الترميز والعرض.

مجموعة بيانات واحدة تم إنشاؤها من واحد أو أكثر من البيانات النقطية.

مرجع إلى البيانات النقطية ، بما في ذلك خصائص الترميز والعرض.

يحدد ما إذا كان سيتم إنشاء إحصاءات البيانات النقطية.

تتم إضافة البيانات النقطية إلى مجموعة بيانات فسيفساء بتحديد نوع البيانات النقطية. The raster type identifies metadata, such as georeferencing, acquisition date, and sensor type, along with a raster format.

Interactive table type in the table values when the tool is run.

The details about the relationship between objects in the geodatabase.

A table that defines how raster cell values will be reclassified.

Route Measure Event Properties

Specifies the fields on a table that describe events that are measured by a linear reference route system.

A schematic dataset contains a collection of schematic diagram templates and schematic feature classes that share the same application domain, for example, water or electrical. It can reside in a personal, file, or ArcSDE geodatabase.

A schematic layer is a composite layer composed of feature layers based on the schematic feature classes associated with the template on which the schematic diagram is based.

Specifies the distance and direction representing two locations that are used to quantify autocorrelation.

Spatial data in shapefile format.

The coordinate system used to store a spatial dataset, including the spatial domain.

A syntax for defining and manipulating data from a relational database.

A representation of tabular data for viewing and editing purposes, stored in memory or on disk.

A reference to a terrain, including symbology and rendering properties. It’s used to draw a terrain.

Data stored in ASCII format.

Specifies the width and the height of a data stored in block.

Specifies the time periods used for calculating solar radiation at specific locations.

A vector data structure that partitions geographic space into contiguous, nonoverlapping triangles. The vertices of each triangle are sample data points with x-, y-, and z-values.

A reference to a TIN, including topological relationships, symbology, and rendering properties.

Features that are input to the interpolation.

A topology that defines and enforces data integrity rules for spatial data.

A reference to a topology, including symbology and rendering properties.

A collection of columns of values.

A data value that can contain any basic type: Boolean, date, double, long, and string.

Specifies the relationship between the vertical cost factor and the vertical, relative moving angle.

Spatial data stored in Vector Product Format.

Attribute data stored in Vector Product Format.

Web Coverage Service (WCS) is an open specification for sharing raster datasets on the web.

A table with data to combine multiple rasters by applying a common measurement scale of values to each raster, weighing each according to its importance.

Specifies data for overlaying several rasters multiplied each by their given weight and then summed.


Species distribution modelling tools

Many of the python scripts contained in SDMtoolbox were initially written for species distribution modelling in Maxent (being specific to the naming syntax, input and output formats). However, many of the tools can be applied to most other types of species distribution models, and when necessary, these tools have been modified to handle SDMs from other methods (contained in the ‘Universal Tools’ heading). Because the universal SDM tools require increased flexibility in input/output formats, often they require additional input information to clarify input/output file associations. For all universal tools with corresponding Maxent tools, the core analyses and processes are identical.

Modelling in Maxent: spatial jackknifing

Spatial jackknifing (or geographically structured k-fold cross-validation) tests evaluation performance of spatially segregated localities. ال run Maxent: spatial jackknife tool splits the landscape into 3–5 regions based on Voronoi polygons and spatial clustering of occurrence points. Models are calibrated with all permutations of the groups using occurrence points and background data from k−1 spatial groups and then evaluated with the withheld group (Table 1g). This tool also facilitates testing different combinations of the five model feature class types and regularization multipliers to optimize model performance (Shcheglovitova & Anderson 2013 Radosavljevic & Anderson 2014 ).

Spatially rarefying occurrence data

Most SDM methods require input occurrence data to be spatially independent to perform well. However, it is common for researchers to introduce environmental biases into their SDMs from spatially autocorrelated occurrence points. The elimination of spatial clusters of localities is important for model calibration and evaluation. When spatial clusters of localities exist, often models are over-fit towards environmental biases (reducing the model's ability to predict spatially independent data) and model performance values are inflated (Veloz 2009 Hijmans 2012 Boria وآخرون. 2014 ). ال spatially rarefy occurrence data tool addresses this issue by reducing occurrence localities to a single point within the user-specified Euclidian distance. This tool also allows users to spatially rarefy their data at several distances according to habitat, topographic or climate heterogeneity (Table 1d). For example, occurrence localities could be spatially filtered at 5, 10 and 30 km 2 in areas of high, medium and low environmental heterogeneity, respectively. This graduated filtering method is particularly useful for studies with limited occurrence points and can maximize the number of spatially independent localities.

Quantifying distributional changes

An increasing use of SDMs is to attempt to predict distributional changes under climate change conditions (both future and past). Here, two tools were created that help summarize distributional changes between two time periods. ال distribution changes between binary SDMs tool calculate the distributional changes between two binary SDMs (e.g. current and future SDMs). Output consists of a table depicting contraction, expansion and stable areas in the species' distribution (in km 2 Fig. 1g). The second tool (centroid changes) also calculates the distributional changes between two binary SDMs (e.g. current and future SDMs) however, this analysis aims to summarize the core distributional shifts in multiple species' ranges. Moreover, this analysis reduces each species' distribution to a single central point (a.k.a. a centroid) and creates a vector depicting magnitude and direction of change through time (Fig. 1f Table 1c). ال limit dispersal in future SDMs tool limits the maximum dispersal distance from current SDMs into future SDMs. This excludes areas that are predicted climatically suitable, but are too distant to be colonized.

Correcting model over-prediction

To limit over-prediction of SDMs, a common problem with modelling species' distributions (Peterson وآخرون. 2011 ), the over-prediction correction: clip models by buffered MCPs tools were created, which clip SDMs by a buffered minimum convex polygon (MCP) generated from the input point data of each species following the approach of Kremen وآخرون. ( 2008 ). This method reduces SDMs to represent suitable habitat within an area of known occurrence (based on a buffered MCP), excluding suitable habitat greatly outside of the observed range (Fig. 1h,i Table 1c).

Creation of friction layers: invert SDM

The use of least-cost paths and along-path distances often dramatically improve the calculation of geographic distances for testing hypotheses (i.e. isolation by distance). However, few studies have access to meaningful friction landscapes (Spear وآخرون. 2010 ). Some researchers generate friction landscapes from classified satellite images where each major habitat type represents a different friction value (i.e. Broquet وآخرون. 2006 ). A primary downfall to using habitat heterogeneity as a friction landscape is the weighing of each habitat class to represent relevant friction values. Proper implementation relies heavily on expert life-history knowledge, and when done, analyses lose some objectivity. For example, Broquet وآخرون. ( 2006 ) adjusted the friction values until they satisfied prior expectations. More recently, authors have used inverted SDMs as friction landscapes, the method implemented in SDMtoolbox (Wang وآخرون. 2008 Chan, Brown & Yoder 2011 ). This method is a more objective alternative to expert knowledge, reducing potential bias, and high-quality SDMs can be generated for most species (Table 1d).

Bias layers for Maxent

A subset of python scripts create bias files used to fine-tune background and occurrence point selection in Maxent. Bias files control where background points are selected and the density of background sampling. Proper use of bias files can avoid sampling habitat greatly outside of a species' known occurrence or can account for both collection sampling biases and latitudinal biases associated with coordinate data.

Background points (and similar pseudo-absence points) are meant to be compared with the presence data and help differentiate the environmental conditions under which a species can potentially occur. Typically background points are selected within a large rectilinear area within this area, there often exists habitat that is environmentally suitable, but was never colonized. When background points are selected within these habitats, this increases commission errors (false positives). As a result, the ‘best’ performing model tends to be over-fit because selection criterion favours a model that fails to predict the species in the un-colonized climatically suitable habitat (Anderson & Raza 2010 Barbet-Massin وآخرون. 2012 ). The likelihood that suitable unoccupied habitats are included in background sampling increases with Euclidian distance from the species' realized range. Thus, a larger study spatial extent can lead to the selection of a higher proportion of less informative background points (Barbet-Massin وآخرون. 2012 ). Researchers should not avoid studying species with broad distributions or those existing in regions that do not conform well to rectilinear map layouts, rather they simply need to be more selective in the choice of background points in Maxent (and pseudo-absences in other SDM methods)(Barve وآخرون. 2011 Merow, Smith & Silander 2013 ).

To circumvent this problem, many researchers have begun using background point and pseudo-absence selection methods that are more regional. SDMtoolbox contains two tools to facilitate more sophisticated background selection for use in Maxent. ال sample by distance from obs. pts. tool uses a common method that samples backgrounds within a maximum radial distance of known occurrences (Fig. 1k see Thuiller وآخرون. 2009 ). ال sample by buffered MCP tool restricts background selection within a buffered minimum convex polygon based on known occurrences (Fig. 1j Table 1e).

One limitation of presence-only data SDM methods is the effect of sample selection bias from sampling some areas of the landscape more intensively than others (Phillips وآخرون. 2009 ). Maxent requires an unbiased sampling of occurrence data, and spatial sampling biases can be reduced by using the Gaussian kernel density of sampling localities أداة. This method produces a bias grid that up-weights presence-only data points with fewer neighbours in the geographic landscape. To do this, the tool creates a Gaussian kernel density of sampling localities (Fig. 1n). Output bias values of 1 reflect no sampling bias, whereas higher values represent increased sampling bias. Depending on the study, the input points could be all sampling localities for a larger taxonomic group or simply the input sampling localities of a focal species. For example, if I were studying a single species of frog from Madagascar, I could use either i) only the occurrence points from that species, or ii) all sampling points from all amphibians in Madagascar. The former focuses on sampling biases in the focal species, where the latter focuses on widespread spatial sampling biases (e.g. sampling only near roads) and likelihood of detection of your species in all surveys.

A last set of bias files address a prevalent issue in species distribution modelling, yet rarely acknowledged, and regard a latitudinal bias in background selection. To understand this bias, the basic difference between a geographic coordinate system and projected coordinate system must be clarified. Briefly, a geographic coordinate system consists of data measured in angles across a globe in the form of latitude and longitude. Different geographic coordinate systems vary in terms of their frames of reference for measuring locations on the surface of the earth however, all utilize degrees latitude and longitude. A projected coordinate system refers to data in a two-dimensional plane that can be measured in fixed linear units (i.e. feet or metres). All SDMs created in geographic coordinate systems (i.e. decimal degrees) in Maxent, and most pseudo-absence-based SDM methods, are biasing their selection of pseudo-absence/background points and unique occurrence points towards the poles (Elith وآخرون. 2011 ). The level of bias depends on the breadth of latitudes of the study area and the heterogeneity of habitats encompassed in the landscape. For example, this is a bigger issue for broadly distributed temperate species than for species distributed around the equator. This is because the area occupied by these units decreases latitudinally and areas are largest at equator and smallest at poles. This inequality results from convergence of the meridians, lines of longitude, towards the poles. There are two solutions to this problem: i) the first corrects the bias sampling problem by correcting how background values and unique occurrence localities are selected. ii) The second solution fixes the problem by projecting all the data into an equal-areas projection (EAP). The latter is the preferred method because it directly addresses the issue of unequal area sizes however, for many modellers, this requires considerable effort and can be confusing due to issues associated with selecting the best EAP. The SDM toolbox facilitates both solutions (Fig. 1l,m Table 1e). See Supplementary Materials for detailed explanation and comparison of these methods.


2 إجابات 2

The main problem here is in the string for i in field: You are trying to iterate a string - field name ("rte_id").

This is not correct. You need to iterate all possible values of field "rte_id".

Easiest solution: if you know that field "rte_id" have values 1 - 70 (for example) then you can try

More sophisticated solution: You need to get a list of all unique values of field "rte_id" in terms of SQL - to perform GROUP BY.

I think it is not actually possible to perform GROUP BY operation on SHP files with one tool.

You can use SearchCursor, iterate through all features and generate a list of unique values of you field. But this is more complex task.

Another way is to use the Summarize option on the shapefile table in ArcMap (open table, right click on the column header). You will get dbf table with unique values which you can read in your script.


بناء الجملة

The input features (point or line) for which to calculate the density.

Field denoting population values for each feature. The population field is the count or quantity to be spread across the landscape to create a continuous surface.

Values in the population field may be integer or floating point.

The options and default behaviors for the field are listed below.

Use None if no item or special value will be used and each feature will be counted once.

You can use Shape if input features contains Z.

Otherwise, the default field is POPULATION . The following conditions may also apply.

  • If there is no POPULATION field, but there is a POPULATIONxxxx field, this is used by default. The xxxx can be any valid character, such as POPULATION6 , POPULATION1974 , or POPULATIONROADTYPE .
  • If there is no POPULATION field or POPULATIONxxxx field, but there is a POP field, this is used by default.
  • If there is no POPULATION field, POPULATIONxxxx field, or POP field, but there is a POPxxxx field, this is used by default.
  • If there is no POPULATION field, POPULATIONxxxx field, POP field, or POPxxxx field, NONE is used by default.

The cell size of the output raster that will be created.

This parameter can be defined by a numeric value or obtained from an existing raster dataset. If the cell size hasn't been explicitly specified as the parameter value, the environment cell size value will be used if specified otherwise, additional rules will be used to calculate it from the other inputs. See the usage for more detail.

The search radius within which to calculate density. Units are based on the linear unit of the projection of the output spatial reference.

For example, if the units are in meters—to include all features within a one-mile neighborhood—set the search radius equal to 1609.344 (1 mile = 1609.344 meters).

The default search radius (bandwidth) is computed specifically to the input dataset using a spatial variant of Silverman's Rule of Thumb that is robust to spatial outliers (that is, points that are far away from the rest of the points). See the usage tips above for a description of the algorithm.

The desired area units of the output density values.

A default unit is selected based on the linear unit of the output spatial reference. You can change this to the appropriate unit if you wish to convert the density output. Values for line density convert the units of both length and area.

If no output spatial reference is specified, the output spatial reference will be the same as the input feature class. The default output density units is determined by the linear units of the output spatial reference as follows. If the output linear units are meters, the output area density units will be set to SQUARE_KILOMETERS , outputting square kilometers for point features or kilometers per square kilometers for polyline features. If the output linear units are feet, the output area density units will be set to SQUARE_MILES .

If the output units is anything other than feet or meters, the output area density units will be set to SQUARE_MAP_UNITS . That is, the output density units will be the square of the linear units of the output spatial reference. For example, if the output linear units is centimeters, the output area density units will be SQUARE_MAP_UNITS , which would result in square centimeters. If the output linear units is kilometers, the output area density units will be SQUARE_MAP_UNITS , which would result in square kilometers.

The available options and their corresponding output density units are the following:

  • SQUARE_MAP_UNITS —For the square of the linear units of the output spatial reference.
  • SQUARE_MILES —For miles (U.S.).
  • SQUARE_KILOMETERS —For kilometers.
  • ACRES —For acres (U.S.).
  • HECTARES —For hectares.
  • SQUARE_YARDS —For yards (U.S.).
  • SQUARE_FEET —For feet (U.S.).
  • SQUARE_INCHES —For inches (U.S.).
  • SQUARE_METERS —For meters.
  • SQUARE_CENTIMETERS —For centimeters.
  • SQUARE_MILLIMETERS —For millimeters.

Determines what the values in the output raster represent.

  • DENSITIES —The output values represent the predicted density value. هذا هو الافتراضي.
  • EXPECTED_COUNTS —The output values represent the predicted amount of the phenomenon within each cell.Since the cell value is linked to the specified cell size, the resulting raster cannot be resampled to a different cell size and still represent the amount of the phenomenon.

Determines whether to use a shortest path on a spheroid (geodesic) or a flat earth (planar) method. It is strongly suggested to use the geodesic method with data stored in a coordinate system that is not appropriate for distance measurements (for example, Web Mercator or any geographic coordinate system) and any analysis that spans a large geographic area.

  • PLANAR —Uses planar distances between the features. هذا هو الافتراضي.
  • GEODESIC —Uses geodesic distances between features. This method takes into account the curvature of the spheroid and correctly deals with data near the poles and the International dateline.

Return Value

The output kernel density raster.

It is always a floating point raster.


Parameters can be grouped into different categories to minimize the size of the tool dialog box or to group related parameters that will be infrequently used. Parameters that set category to the same string value will be grouped together. Several ArcGIS Network Analyst extension tools use categories, as shown below.

Categories are always shown after noncategorized parameters. Do not put required parameters into categories, as they are hidden from view on the tool dialog box.


Occasionally, the need arises for a parameter to accept multiple data types, often referred to as a composite data type. In a Python toolbox, composite data types are defined by assigning a list of data types to the parameter's datatype property. In the example below, a parameter is defined that accepts a Raster dataset or a Raster catalog.

A dataset used for geocoding that stores the address attributes, associated indexes, and rules that define the process for translating nonspatial descriptions of places to spatial data.

A template on which to base the new address locator.

The cell size used by raster tools.

A data type that accepts any value.

A file that contains one map, its layout, and its associated layers, tables, charts, and reports.

An areal unit type and value, such as square meter or acre.

A vector data source mixed with feature types and symbology. The dataset is not usable for feature class-based queries or analysis.

The top-level node in the Catalog tree.

The cell size used by the ArcGIS Spatial Analyst extension .

Defines the two sides of a raster cell.

A reference to several children layers, including symbology and rendering properties.

Specifies the type of compression used for a raster.

A reference framework, such as the UTM system consisting of a set of points, lines, and/or surfaces, and a set of rules used to define the positions of points in two- and three-dimensional space.

Coordinate Systems Folder

A folder on disk storing coordinate systems.

A coverage dataset, a proprietary data model for storing geographic features as points, arcs, and polygons with associated feature attribute tables.

A coverage feature class, such as point, arc, node, route, route system, section, polygon, and region.

A dataset visible in ArcCatalog .

The database connection folder in ArcCatalog .

A collection of related data, usually grouped or stored together.

Attribute data stored in dBASE format.

Specifies a subset of nodes of a TIN to create a generalized version of that TIN.

An access path to a data storage device.

Any floating-point number stored as a double precision, 64-bit value.

Encrypted string for passwords.

The coordinate pairs that define the minimum bounding rectangle in which the data source falls.

The scale value range and increment value applied to inputs in a weighted overlay operation.

Specifies the coordinate pairs that define the minimum bounding rectangle (xmin, ymin and xmax, ymax) of a data source. All coordinates for the data source fall in this boundary.

An extract values parameter.

A collection of spatial data with the same shape type: point, multipoint, polyline, and polygon.

A collection of feature classes that share a common geographic area and the same spatial reference system.

A reference to a feature class, including symbology and rendering properties.

Interactive features that draw the features when the tool is run.

A column in a table that stores the values for a single attribute.

The details about a field in a FieldMap.

A collection of fields in one or more input tables.

Specifies a location on disk where data is stored.

A raster surface whose cell values are represented by a formula or constant.

Specifies the algorithm used in fuzzification of an input raster.

A collection of data with a common theme in a geodatabase.

A coarse-grained object that references a geodatabase.

A linear network represented by topologically connected edge and junction features. Feature connectivity is based on their geometric coincidence.

A reference to a geostatistical data source, including symbology and rendering properties.

Geostatistical Search Neighborhood

Defines the searching neighborhood parameters for a geostatistical layer.

Geostatistical Value Table

A collection of data sources and fields that define a geostatistical layer.

A collection of layers that appear and act as a single layer. Group layers make it easier to organize a map, assign advanced drawing order options, and share layers for use in other maps.

The relationship between the horizontal cost factor and the horizontal relative moving angle.

A data structure used to speed the search for records in geographic datasets and databases.

A syntax for defining and manipulating data in an INFO table.

A table in an INFO database.

A LAS dataset stores reference to one or more LAS files on disk as well as to additional surface features. A LAS file is a binary file that stores airborne lidar data.

A layer that references a LAS dataset on disk. This layer can apply filters on lidar files and surface constraints referenced by a LAS dataset.

A reference to a data source, such as a shapefile, coverage, geodatabase feature class, or raster, including symbology and rendering properties.

A layer file stores a layer definition, including symbology and rendering properties.

A shape, straight or curved, defined by a connected series of unique x,y-coordinate pairs.

A linear unit type and value such as meter or feet.

A range of lowest and highest possible value for m-coordinates.

A collection of raster and image data that allows you to store, view, and query the data. It is a data model in the geodatabase used to manage a collection of raster datasets (images) stored as a catalog and viewed as a mosaicked image.

A layer that references a mosaic dataset.

The shape of the area around each cell used to calculate statistics.

Network Analyst Class FieldMap

Mapping between location properties in a Network Analyst layer (such as stops, facilities, and incidents) and a point feature class.

Network Analyst Hierarchy Settings

A hierarchy attribute that divides hierarchy values of a network dataset into three groups using two integers. The first integer sets the ending value of the first group the second number sets the beginning value of the third group.

A special group layer used to express and solve network routing problems. Each sublayer held in memory in a Network Analyst layer represents some aspect of the routing problem and the routing solution.

A network data source can be a local dataset specified either using its catalog path or a layer from a map, or it can be a URL to a portal.

A collection of topologically connected network elements (edges, junctions, and turns), derived from network sources and associated with a collection of network attributes.

A reference to a network dataset, including symbology and rendering properties.

A dictionary of travel mode objects.

A parcel fabric is a dataset for the storage, maintenance, and editing of a continuous surface of connected parcels or parcel network.

A layer referencing a parcel fabric on disk. This layer works as a group layer organizing a set of related layers under a single layer.

A connected sequence of x,y-coordinate pairs, where the first and last coordinate pair are the same.

A file storing coordinate system information for spatial data.

Specifies if pyramids are built.

Specifies which surrounding points are used for interpolation.

Specifies the seed and the generator to use when creating random values.

A layer in a raster dataset.

Raster Calculator Expression

A raster calculator expression.

A collection of raster datasets defined in a table. Each table record defines an individual raster dataset in the catalog.

A reference to a raster catalog, including symbology and rendering properties.

A single dataset built from one or more rasters.

A reference to a raster, including symbology and rendering properties.

Specifies if raster statistics build.

Raster data is added to a mosaic dataset by specifying a raster type. The raster type identifies metadata, such as georeferencing, acquisition date, and sensor type, with a raster format.

Interactive table type in the table values when the tool is run.

The details about the relationship between objects in the geodatabase.

A table that defines how raster cell values are reclassified.

Route Measure Event Properties

Specifies the fields on a table that describe events measured by a linear reference route system.

A schematic dataset contains a collection of schematic diagram templates and schematic feature classes that share the same application domain, for example, water or electrical.

A schematic diagram class.

A schematic layer is a composite layer composed of feature layers based on the schematic feature classes associated with the template on which the schematic diagram is based.

Specifies the distance and direction representing two locations used to quantify autocorrelation.

Spatial data in a shapefile format.

The coordinate system used to store a spatial dataset, including the spatial domain.

A syntax for defining and manipulating data from a relational database.

A string that is masked by * characters.

The text is not encrypted when used in scripting.

A representation of tabular data for viewing and editing purposes, stored in memory or on disk.

A reference to a terrain, including symbology and rendering properties. It’s used to draw a terrain.

Specifies the width and the height of data stored in block.

Specifies the time periods used for calculating solar radiation at specific locations.

A time unit type and value such as minutes or hours.

A vector data structure that partitions geographic space into contiguous, nonoverlapping triangles. The vertices of each triangle are sample data points with x-, y-, and z-values.

A reference to a TIN, including topological relationships, symbology, and rendering properties.

Features that are input to the interpolation.

A topology that defines and enforces data integrity rules for spatial data.

A reference to a topology, including symbology and rendering properties.

A Spatial Analyst transformation function.

A collection of columns of values.

A data value that can contain any basic type: Boolean, date, double, long, and string.

Specifies the relationship between the vertical cost factor and the vertical, relative moving angle.

Spatial data stored in Vector Product Format.

Attribute data stored in Vector Product Format.

Web Coverage Service (WCS) is an open specification for sharing raster datasets on the web.

A table with data to combine multiple rasters by applying a common measurement scale of values to each raster, weighing each according to its importance.

Specifies data for overlaying several rasters, each multiplied by their given weight and summed.


شاهد الفيديو: GIS Python: Count shape files and Select by Location 2 Real world ArcPy examples