banner
ニュース センター
彼らの技術における卓越した専門知識。

人間

May 12, 2023

Scientific Reports volume 13、記事番号: 8699 (2023) この記事を引用

921 アクセス

1 オルトメトリック

メトリクスの詳細

この論文では、メソポタミアの氾濫原環境内の遺跡を検出するために、事前トレーニングされたセマンティック セグメンテーション ディープ ラーニング モデルを使用して得られた結果を示します。 モデルは、公開されている衛星画像と、大規模な注釈コーパス (つまり、調査対象サイト) から得られるベクトル形状を使用して微調整されました。 ランダム化テストにより、最良のモデルは 80% 付近の検出精度に達することがわかりました。 提案されたマスクが予測としてカウントされるかどうかの定義は非常に主観的であるため、データセットの構築方法と予測の評価方法を定義するには、ドメインの専門知識を統合することが重要でした。 さらに、不正確な予測であっても、訓練を受けた考古学者が文脈に当てはめて解釈すれば、役立つ場合があります。 これらの考察から、人間と AI のコラボレーション ワークフローのビジョンを示してこの文書を締めくくります。 人間の専門家によって洗練された注釈付きのデータセットから始めて、予測を組み合わせてヒートマップを作成したり、衛星画像や航空写真に重ねたり、あるいはベクトル化して GIS でさらなる分析を行うことができるモデルを取得します。ソフトウェアにより簡単かつ自動化されます。 次に、考古学者は予測を分析し、現地調査を整理し、新しい修正された注釈でデータセットを改良することができます。

この論文は、航空写真 (この場合は衛星画像) から潜在的な考古学的遺跡を検出するタスクを支援できる人工知能 (AI) システムの作成を目的とした、データ サイエンティストと考古学者のコラボレーションの成果を文書化したものです。 セマンティック セグメンテーション モデルを使用すると、正確な輪郭を描くことができ、人間参加型の評価では、検出精度が 80% 付近であることがわかりました。

この手順は、離れた場所から関心のある地点を検出および/または監視する行為を示すリモート センシング (RS) の領域に分類されます。 考古学の世界では、より多くのより優れた衛星画像が利用可能になり、古い情報源(コロナ衛星画像など)と組み合わせて、より多くの遺跡を発見し、その遺跡を追跡できるようになったことで、この作業は非常に貴重なものとなっています。人間的要因による継続的な劣化1. 調査範囲と調査対象の考古学的特徴の規模によっては、特に時間の面で、研究者にとって必要な労力が膨大になる場合があります。

このコラボレーションは、完全に自動化するわけではありませんが、深層学習モデルを使用してプロセスを合理化することで、まさにこの問題を解決することを目的としていました。 したがって、メソポタミア南部の氾濫原の考古学的に記録されたすべての遺跡 (十分に一貫した地形学的領域を表す) のベクトル形状のデータセットから開始して、与えられた入力画像内の遺跡を検出してセグメント化するモデルをトレーニングしました。 プロジェクトが進むにつれて、この問題への取り組みを特に困難にする多くの問題が明らかになり、ディープラーニングの使用全般と人間の専門家との関係についての重要な反省につながりました。 このデータセットは、約 5000 の遺跡を含む近東考古学としては非常に大規模なものであると考えられますが、今日使用されている最先端のものと同じくらい大規模なモデルをトレーニングするにはほとんど十分ではありません。には、特定の古い画像でのみ表示されるケースが多数含まれています。 最初の問題は一般に転移学習によって解決されます2。 この手法は、大規模で一般的なデータセット (imagenet3 など) で事前トレーニングされたモデルから開始し、次に、新しいタスクを作成するために以前に学習したスキルを活用しながら、より小さいがより具体的なデータセットでモデルを微調整することで構成されます。より管理しやすくなります。 ただし、2 番目の方法では、トレーニングと評価の両方が危険にさらされます。これは、モデルがトレーニング中に間違った分類を行うよう強制され、たとえ悪い例を無視する堅牢な表現を学習したとしても、間違いであるかどうかを検出するのが困難になるためです。モデルまたはラベルによって異なります。

私たちは、この難題を解決する唯一の方法は、人間参加型のアプローチによるものであると信じています1。 このため、論文全体を通じて、実験のトレーニングと評価段階でドメインの専門知識を統合することの重要性を強調しています。これは、使用するデータセット、ひいてはモデルを改善する上で非常に重要であるためです。 この反復プロセスの最終結果は、約 80% の検出精度が可能なモデルです。

これらの有望な結果に基づいて、私たちは考古学者のリモートセンシング作業を(代替するのではなく)サポートする人間とAIのコラボレーションツールを構想し、考古学者の作業とモデルの両方を強化する新しい種類のワークフローを提案します。使用するたびに4、5。 すべての結果は、オープンソース ソフトウェアとモデル、オープンに利用可能なデータ (画像、注釈) と計算リソース (Google Colab) を使用して達成されたため、リソースに制約のある研究環境でも、この種の研究は非常にアクセスしやすく、再現可能です。 言及されているすべてのコード、データ、リソースは GitHub (https://bit.ly/NSR_floodplains) で入手できます。

メソポタミア南部の氾濫原は、人間コミュニティの空間的集合と、半乾燥環境にある灌漑農地の開発との間の複雑な相互作用を理解する上で重要な地域です6。 この地域におけるロバート・マコーミック・アダムスの調査は 7、8、9 、当時としては前例のない基準に従って実施されました。彼は 1961 年の一連の航空写真を使用して、候補地の位置を特定し、地表に痕跡が見える運河の地図を作成しました。 彼は、紀元前 7 千年紀後半からオスマン帝国時代に至るまで、体系的に現場を記録しました。 何よりも、彼は自分の測量活動の歴史学的な可能性を痛感しており、その結果、居住パターンと水理活動についての強力な解釈がもたらされました8。

政情不安による現地調査の長い中断を経て、近年イラク南部で考古学研究が再開された。概要については10を参照。 この地域では通常、遺跡はアラビア語で塚を意味する「Tell」という言葉で呼ばれます。 これらの丘の色と形は、航空写真や衛星画像で特に目立つため、その位置を発見するための実行可能な戦略としてリモート センシングの使用につながりました。

トニー・ウィルキンソンが述べているように、「テルは、占領地が静止したままであることもあり、建物レベルと時間の経過とともに蓄積された蓄積された廃棄物の複数の層で構成されています。テルの居住地は、蓄積された物質を封じ込め、拘束する外壁によって定義されることがよくあります。それにより、その拡散が制限されます […]. テルは決して占領の販売場所ではありません […]. 外側または下の町は […] 多くの場合、低いこぶとして、または単純にテルの周りに散らばる人工物として現れ、それらは総占有面積を拡大する可能性がありますサイトの数倍」11.

メソポタミアでは、テルスは周囲の田園地帯よりわずかに標高が高いことが多く、そのような場合、灌漑可能な農地を確保するために人為的に整地が行われる傾向にあります。 したがって、そのような動的な環境におけるサイトの自動検出は非常に複雑な操作ですが、コントラストはその試みを正当化するのに十分にマークされています。

リモートセンシングとは、直接観察を必要とせずに、関心のある地点を検出または監視するための任意のセンサー (すなわち、温度、湿度、ハイパースペクトル、衛星画像など) の使用を指します。 このアプローチはさまざまな分野に関連しますが、あるドメインで機能するソリューションが他の分野に応用できるとは限りません。

確かに、現代のコンピューター技術が登場する以前でも、調査対象地域の航空写真や地形図を使用して、考古学的遺跡を遠隔地から特定することは可能でしたが、現在では、異なる性質のセンサーや異なる時点からのセンサーを使用して、複数の情報源を組み合わせることが容易になっています。特に環境は自然または人為的な要因によって変化する可能性があるため、環境のより完全な全体像を把握するためです12、13、14。 サイトの特性に応じて、立体画像から得られる標高モデルや、赤外線や電波などの可視光以外の電磁スペクトル部分の使用など、特定の表現が役立つ場合があります15、16。 Light Detection and Ranging (LiDAR) も、満足のいく高解像度画像が得られるため普及しつつありますが、ドローンなどの何らかの航空機に搭載する必要があることが多いため、採用が難しい場合があります17。 この種のソースの問題は、すべての場所で利用できるわけではないことや、当面のタスクに十分な解像度がないことです。 一方で、特に Google マップや Bing Maps などのオンライン サービスの普及により、地球上の事実上あらゆる場所の高品質のオープンソース RGB 画像が簡単に入手できます。 具体的には、このプロジェクトでは、Bing Maps サービスの衛星画像を使用します。これにより、分析対象地域について、私たちが焦点を当てている人為的痕跡の優れた可視性が得られます。

ディープラーニングはあらゆる応用分野でさまざまな用途に使用されており、考古学も例外ではありません。 これは、オブジェクトとテキストの分類、類似点の発見、3D モデルの構築、そしてこの論文でも説明されているように、サイトの検出に役立ちます 18、19、20、21、22。 このようなモデルを扱う際の難しさは、考古学と深層学習の両方の分野の専門家が協力する必要があることですが、利用可能なデータの量にも依存する可能性があります。 ニューラル ネットワークはデータを大量に消費することで知られており、ビックラー氏が言うように考古学は「データが遅い」分野です23。 それにもかかわらず、ディープラーニングがさまざまな異なるシナリオでサイト検出にうまく適用されている最近の例がいくつかあります24、25、26、27。 ほとんどのアプリケーションは、ニューラル ネットワークを使用して、分類、検出、またはセグメンテーション タスクを実行します。 1 つ目は、対象のサイトを含むかどうかがマークされたマップからサンプリングされたタイルを使用します。 2 番目の方法では、代わりに、オブジェクトの周囲の境界ボックスを予測し、必要に応じてそれを分類します。 3 番目のステップでは、個々のピクセルが分類され、その結果、サイトに対応する形状が予測されます。 このホワイトペーパーでは、以下で説明する 2 番目のアプローチを使用します。

セマンティック セグメンテーションは、画像を特定の意味を持つ単位に対応する部分に分割するタスクです。 これらは、特定の主題 (例、人物、車両などの輪郭) または複数のエンティティ (建物、背景など) を包含する一般的なカテゴリに対応できます。 この文書の文脈では、カテゴリーは 2 つだけです。1 つは塚のある (Tell) サイト用で、もう 1 つはその他すべてのものです。 セグメンテーションは、ピクセルレベルの分類を実行するさまざまな手法を使用して実行できます。 非常に一般的なアプローチでは、事前に計算された特徴、何らかのアルゴリズムによって抽出された特徴、または手動で設計された特徴が使用され、その後、ランダム フォレスト アルゴリズムによって分類されます28。 現在の最先端技術は、畳み込みニューラル ネットワークを使用した深層学習に基づくエンドツーエンド システムによって表されます。 このアプローチにとって、医療画像の文脈における Ronnenberger による U-Net の導入は画期的な出来事でした 29。 この研究では、MA-Net30 と呼ばれるより新しいアーキテクチャを利用しています。これは、人気のある Transformer アーキテクチャで提案されているセルフ アテンション メカニズムを組み込んだ U-Net アーキテクチャのアップグレードと考えることができます31。 これにより、モデルはコンテンツに応じてさまざまな潜在的特徴を重み付けし、より良く学習するためにこの潜在的空間のどこに「注意を払う」かを比喩的に指定することができます。 これは医療画像処理の文脈で開発されましたが、リモート センシング タスクでも使用できることがわかっています 32,33。 以下の「材料と方法」セクションで詳細を説明します。

以前の論文では、マップをタイルに分割する画像分類アプローチを使用して、これと同じ問題に取り組もうとしました34。 ただし、その実験ではデータセットが桁違いに小さかったため、パフォーマンスを向上させるためには積極的なデータ拡張に頼らなければなりませんでした。 最良のモデルでは約 70% の AUC スコアが得られましたが、マップの見えない部分でテストすると、多くの誤検知を予測し、一部のサイトも欠落するという点で限界が示されました。 このタイルベースの分類アプローチの最大のトレードオフは、タイルのサイズと、より実用的ではありますが詳細が失われる大きな正方形による予測の粒度の間です。 タイルの端に位置するサイトを処理するという問題もあります。 私たちが試した解決策は、ギャップを埋めるためにタイル間にタイルを配置したシングル データセットを作成することでした。 ただし、これにより、作成される予測の量が大幅に増加しました。 最後に、画像分類のほとんどのモデルは、固定サイズの入力の使用に制限されており、マップを扱う場合には大きな制限となる可能性があります。 この新しい実験では、データセットのサイズが増加したことを考慮して、入力サイズの制限と粒度のトレードオフの両方に対処する完全畳み込みレイヤーを備えた画像セグメンテーション モデルを活用することにしました。

このセクションでは、まず使用するデータセットについて説明します。このデータセットは公開されているリソースから構築され、次にそのデータセットに基づいて微調整されたオープンソース モデルについて説明します。

私たちは、図 1 に示すように、66,000 km2 にわたる氾濫原プロジェクトの調査地域内の既知の塚跡の等高線に対応する、地理参照されたベクトル形状のデータセットから開始しました。このデータセットは、すべてのデータをファイルしてボローニャ大学で開発されました。この地域で公開された考古学的調査と、そこにカタログ化された遺跡の地理参照 (https://floodplains.orientlab.net) - 4934 個の形状が含まれており、したがってすべての遺跡は地上調査とそれに関連する研究によって確認された遺跡に言及しています。アーティファクトの表面散乱。

調査エリア。 オレンジ色の点は、メソポタミアの氾濫原の調査対象地を表します。 赤い実線の長方形は、メイサンで選択されたテスト エリアです。 表示されるすべてのデータは、学術目的での地理データのフェアユース利用の条件に該当します。 関連するすべてのデータ/ソフトウェア プロバイダーのリストは次のとおりです。 (i) Microsoft Bing Maps Platform API の使用条件 (https://www.microsoft.com/en-us) のセクション 5 に基づくオリジナル マップの作成/maps/product/print-rights); (ii) QGIS (https://qgis.org/en/site/) および QuickMapsServices (https://github.com/nextgis/quickmapservices) の GNU ライセンスに基づいて、オープン ソース ソフトウェアで実現される地図表示。 (iii) 著者が開発し、(https://bit.ly/NSR_floodplains) で入手可能なソフトウェアを使用して最終的な地図を精緻化します。

このデータセットは、深層学習モデルをトレーニングするためというよりも、考古学者のための包括的な情報源として編集されたため、情報を提供せず、実際に学習プロセスを損なう可能性のあるいくつかの例を除外する必要がありました。 これらはデータセットの残りの部分よりもかなり大きく、目視検査により、単なる塚ではない地域の形状に従っていることが確認されたため、地域別の上位 200 サイトを削除することから始めました。 200 という数字は、これらのサイトの面積が入力として使用する正方形の領域よりも大きいため、完全に完全なセグメンテーション マスクが生成される可能性があり、あまり役に立たないことに気づいた結果として現れました。 データサイエンティストと考古学者の間で議論した後、これが優れたヒューリスティックな解決策であるとの結論に達しました。

さらに、テルとしては小さすぎるエリア、または考古学者によって破壊されたと指定された 684 の遺跡を除外しました。 特に、サイズのしきい値は、直径 30 m の円に相当する約 1000 m2 に設定されました。 これらの非常に小さなサイトは、実際には、サイズや正確な位置が不明な既知のサイトの一般的な注釈に対応します。

事前トレーニングされたモデルを微調整するための一連の画像を生成するために、上記の形状をオープンソース GIS ソフトウェアである QGIS にインポートし、Python スクリプトを使用して、サイトの重心を中心とする長さ L の正方形を保存しました。 Bing Maps からの衛星画像のみ (Bing Maps を含むさまざまなオンライン サービスによって提供される画像へのアクセスを可能にする QuickMapService プラグインを介して GIS 環境に直接表示されます)。 次に、同じ画像をベース マップなしで保存しましたが、グラウンド トゥルース マスクとして機能するために、敷地の輪郭を単色で塗りつぶした形状として表しました。

したがって、トレーニング中に、ニューラル ネットワークは、RGB 衛星画像を見るだけで、現場の形状を正確に再現することを学習します。 推論中に、特定の入力画像内に新しいサイトがある場合は、そのサイトを検出して概要を説明できます。

最初の実験では L を 1000 m に設定しましたが、より大きなコンテキストが含まれるため、予測エリアのサイズを大きくすると有益になる可能性があると想像しました。 そこで、L=2000mでも試してみたところ、全体的に性能が向上しました。

最初の正方形の画像から、長さ L/2 の正方形をランダムに切り取って、入力として使用します。 これにより、サイトが常に入力の中心に表示され、さらにデータ拡張として機能する偏った表現をモデルが学習しないことが保証されます。 このトリミングのほかに、ランダムな回転とミラーリング、および明るさとコントラストのわずかなシフトを適用することでデータセットを拡張します。これらの操作はすべて、トレーニング反復ごとに異なる方法で適用されます。 QGIS から抽出するとき、1 メートルあたり約 1 ピクセル (1000 メートルで 1024 ピクセル、入力サイズが増加したモデルの 2 倍) の解像度で画像を保存しましたが、計算要件を緩和するために入力はその半分にスケ​​ールダウンされました。全体的なパフォーマンスへの影響は低い36。

最後に、考古学者が提案した場所からサンプリングした、空のマスク (予測できる場所がない) を含む 1,155 枚の画像を紹介しました。 これらには、高度に都市化された地域、集約農業地域、洪水の危険にさらされる場所(つまり、人工の湖や盆地)、岩の多い丘や山が含まれます。

この数は、提案された各領域とタイルのサイズを考慮して、任意に選択されました。 したがって、最終的な画像数は 5025 です。データセットを 90% のトレーニング セットと 10% のホールドアウト テスト セットに分割し、追加した「空の」画像を階層化しました。 トレーニング セットの 10% も、検証セットとして使用するためにランダムに選択されました。

私たちは、追加の入力として CORONA 画像を統合することを試みました37。通常の考古学ワークフローと同様に、歴史的画像は非常に有用であり(開発の影響がはるかに少ない状況を指すため)、衛星ベースマップや地形図と組み合わせることがよくあります(ただし、ここでは CORONA を補完として使用しましたが、CORONA のみの自動検出は追求しなかったため、1970 年代以降に破壊されたサイトは分析から除外されました)。 画像を QGIS にインポートした後、同じ手順に従って入力を作成し、Bing と CORONA 画像の両方で切り抜き操作が同等であることを確認しました。

このプロジェクトは、サイト検出ツールとしての事前トレーニング済みセマンティック セグメンテーション モデルの実現可能性を調査する実験として始まりました。 このため、PyTorch で書かれたライブラリの一部として利用できる、事前トレーニング済みのオープンソース モデルを比較することにしました。 このライブラリを使用すると、特徴抽出用のエンコーダ畳み込みニューラル ネットワークとセグメンテーション アーキテクチャを独立して選択できるほか、さまざまな損失関数を多数提供できます38。

以前の予備論文では、アーキテクチャ、エンコーダ、損失関数のさまざまな選択を実験しました 36。 U-Net と MA-net、Resnet18 と Efficientnet-B3、Dice 損失と Focal Loss を比較しました。 パフォーマンスの違いは小さく、せいぜい数パーセント ポイント以内でしたが、これはランダムなデータの増加による変動によって非常によく説明できます。

それにもかかわらず、MA-net、Efficientnet-B3、Focal Loss を使用し、20 エポックでトレーニングされた最良のモデルを採用しました。 私たちはフィルタリング手順の効果をさらにテストし (以前の作業からわずかに改善されました)、さらに CORONA 画像の導入と入力サイズの増加を実験しました。

また、サマルカンドのウズベキスタン・イタリア考古学プロジェクトによって作成された別の大規模なデータセット (https://www.orientlab.net/samark-land/) に対して追加のテストを実行しました 39。 メソポタミアのテルとウズベキスタンのテパの類似性を考慮して、追加の再トレーニングを必要とせずにモデルがこれらのサイトを検出できるかどうかを確認したいと考えました。

このデータセットには、さまざまな方法で分類された 2,318 個の点のような注釈が含まれており、保存状態に関連する属性も付いています。 私たちは、テパまたはローマウンドに分類され、保存状態の良いラベルが付いている遺跡のみを選択しました。 最終的なサイトの数は、148 テパと 67 マウンドの 215 で終了します。 実際のテスト セット イメージは、上記と同じ手順に従って作成されました。

まず、テスト データセットの平均交差オーバーユニオン (IoU) スコアの観点から結果を示します。 メトリクスを次のように定義します: \(IoU = \frac{P\cap G}{P\cup G}\) ここで、P は予測された形状を示し、G はグラウンド トゥルースの形状を示します。 IoU は、データセット内の予測された形状とアノテーションの間の一致度を表します。 これはモデルがどのように動作するかについてのアイデアを提供し、最適なモデルを選択するのに役立ちますが、それが識別されたサイトの数を示すものではないことを認識する必要があります。これが私たちの主な目的です。

表 1 は、「方法」セクションで説明した、ホールドアウト データセットのすべてのモデルの結果をまとめたものです。 各モデルについて、平均スコアとそれに関連する標準偏差が報告されることに注意してください。 これは、テスト セットであっても画像に対してランダムなトリミングを実行しているため、この効果を平均化するために異なるトリミングを使用して 10 回のテストを実行します。

まず注目できるのは、入力サイズの増加による顕著な改善です。 領域が大きいほど、予測により多くのコンテキストが提供され、モデルがより正確になると考えられます。 重要なのは、上で説明したフィルタリング手順です。これは、小さくて検出できないサイトを削除しようとするため、入力サイズに関係なくパフォーマンスが向上します。

最後に、CORONA の画像の使用については少し議論の余地があります。 入力サイズが小さい場合、利点はないようです (エラー スコアの低下は誤差の範囲内です)。これは、この画像の解像度が低いことが原因であると仮定できます。 より大きな領域では、おそらく再びコンテキストがより広いため、パフォーマンスが向上するようです。 ただし、予測を検査すると、顕著な違いがないことが明らかになりました。これは、おそらく、輪郭がわずかに正確になった結果として IoU が増加していることを意味します。

結果をさらに評価するために、検出精度に移りました。 まず、よく知られているライブラリ GDAL40 を使用してモデルからのラスター予測をベクトル形状に変換し、次にサイトの注釈と予測の間の交差部分を探しました。 より滑らかな形状を得るために、変換前にまず予測ラスターにガウスぼかしを適用し、次に特定のしきい値 (0.5、ただし、数値は多かれ少なかれ感度の高いモデルで変更できます) を超える値を 1.0 にクリップしました。一方、その他の値はすべて 1.0 に切り捨てられました。 0.0に設定してください。

この自動評価では、モデル 5 の精度スコアが 62.57%、モデル 6 の精度スコアが 60.08% と、良好ではありますがあまり刺激的ではない結果が得られます。3 つのサイトのうち 2 つを見つけることができるモデルは、人間による分析の適切な開始点としてすでに提供されています。 ただし、考古学者は予測の検証を提供し、モデルが適切な間違いを犯した場合と、人間でも行うであろう正当な間違いを犯した場合を区別する必要があります41、42、43。

まず第一に、現在の衛星画像ではもはや見ることができず、データセットからフィルタリングされていないサイトがかなりの数あります。 注釈の半分だけが追加情報を持ち、可視性を示す情報がさらに含まれていなかったため、これは予想されていました。 モデルが輪郭を生成しない場合、表示されなくなった部位のみを含む入力画像は、偽陰性ではなく真陰性とみなされる必要があります。

誤検知としてマークされた予測に関しては、モデルがテスト対象のサイトではなく、近くにある別のサイトを予測する場合があります。 これは、「見逃した」サイトの性質に応じて、間違いとみなされるかそうでないかが考えられます。 見逃したサイトがもう表示されていないものの、ほぼ表示されているサイトが検出された場合、予測は実際には真陽性になります。 一方、見逃したサイトは、まだ表示されているものの、写真内の別のサイトよりも表示されていない可能性があります。 この状況では、偽陰性と真陽性の両方を考慮することも、現実世界のシナリオでは他のサイトに近いことが人間の専門家として有用な提案をもたらすことを考慮して、真陽性としてのみ考慮することもできます。そうすれば、それらをすべて取得できるようになります。 あるいは、非表示サイトの考慮を完全に避けることもできますが、その差は最小限になります (精度 78.37%、再現率 82.01%)。

最後に、いくつかの予測は実際に出力に存在していましたが、設定したカットオフしきい値に対しては小さすぎました。 これらのエラーは調整しませんでしたが、予測をオーバーレイとして使用し、手動でマップを確認するという、インタラクションの可能なアプローチを示しています。 あるいは、より低いしきい値を設定すると問題が解決される可能性があります。

この調整により精度と再現率が約 80 まで向上し、実際のモデルのパフォーマンスをより客観的に把握できるようになります。

表 2 は、自動評価の結果と、目に見えない部位を強調表示した人間の評価後の調整値をまとめたものです。 次の方程式は、真/偽陽性/陰性の観点から使用されるメトリックを定義します。 精度、精度、再現率、およびマシューズ相関係数を選択しました。

より高い IoU スコアを獲得したモデル 6 が実際に現在どのようにパフォーマンスが悪くなっているかを見るのは興味深いことです。 画像を見ると、このモデルはもう少し抑制的で慎重であるため、肯定的な予測が少なくなり、誤検知が少なくなっているように見えます。 これにより、Union 項が減少し、エリアがもう少し正確であれば、Intersection 項も増加するため、IoU が高くなる可能性があります。 ただし、検出のためには完全一致ではなく交差の存在が必要であり、この状況では陽性の数が少ないことが不利になります。 全体として、精度の差はそれほど大きくないため、両方のモデルは便利で並行して使用できますが、モデル 6 を少し面倒にする 2 セットの入力画像を使用することによる追加の複雑さとコストも考慮する必要があります。 このため、モデル 5 のみを使用することにしました。

このサブセクションは図 2 で締めくくりました。図 2 には、モデルの出力の品質を示すテスト データセットの例がいくつか含まれています。 色が確率値にどのように対応しているか、また、ベクトル形状の作成時に使用した 0.5 のしきい値によって淡い領域がカットされることに注意してください。 このモデルは、現場の輪郭をトレースする際に非常に正確であり、場合によっては (つまり、図 2 の最初の列)、現在の衛星画像に関するグラウンド トゥルースよりもさらに正確です。

テストセットからのいくつかのサンプル予測。 左側は、入力画像にオーバーレイされたターゲット マスクです。 右側はモデルの出力です。 カラーバーは分類確率に対応します。 モデルがどのようにして敷地の輪郭と正確に一致することができるかに注目してください。 表示されるすべてのデータは、学術目的での地理データのフェアユース利用の条件に該当します。 関連するすべてのデータ/ソフトウェア プロバイダーのリストは次のとおりです。 (i) Microsoft Bing Maps Platform API の使用条件 (https://www.microsoft.com/en-us) のセクション 5 に基づくオリジナル マップの作成/maps/product/print-rights); (ii) QGIS (https://qgis.org/en/site/) および QuickMapsServices (https://github.com/nextgis/quickmapservices) の GNU ライセンスに基づいて、オープン ソース ソフトウェアで実現される地図表示。 (iii) 著者が開発し、(https://bit.ly/NSR_floodplains) で入手可能なソフトウェアを使用して最終的な地図を精緻化します。

検出パフォーマンスを評価した後、リモート センシングを実行した未調査のメイサン州内の長方形のエリアでモデルを試したいと考えました。 このテストの目的は、モデルが予測する誤検知の数を評価し、運用シナリオでモデルが犯す間違いの例を示すことです。

私たちが選択した地域には 20 の疑わしい場所が含まれており、その面積は 104 平方キロメートルです。 図 3 は、考古学者による注釈とモデルによる予測を含む領域を示しています。 見てわかるように、モデルは 20 個のサイトのうち 17 個を回復でき、同時に約 20 個以上の形状 (単一のインスタンスとみなされるものに応じてそれ以下) を提案します。 それらの提案のほとんどは役に立ちませんが、専門家の目によって、特にそのサイズや場所を考慮した文脈で簡単かつ迅速に選別されます。

メイサン州のテストエリア (ピンク、点線) と考古学者によって遠隔で特定された遺跡 (青、点塗り) およびモデル予測 (黄色、線塗り)。 訓練された目とモデルによって特定された部位は同等であり、最も重要なことは、モデルは重要な特徴のない領域を無視できることです。 表示されるすべてのデータは、学術目的での地理データのフェアユース利用の条件に該当します。 関連するすべてのデータ/ソフトウェア プロバイダーのリストは次のとおりです。 (i) Microsoft Bing Maps Platform API の使用条件 (https://www.microsoft.com/en-us) のセクション 5 に基づくオリジナル マップの作成/maps/product/print-rights); (ii) QGIS (https://qgis.org/en/site/) および QuickMapsServices (https://github.com/nextgis/quickmapservices) の GNU ライセンスに基づいて、オープン ソース ソフトウェアで実現される地図表示。 (iii) 著者が開発し、(https://bit.ly/NSR_floodplains) で入手可能なソフトウェアを使用して最終的な地図を精緻化します。

代わりに、図 4 は、さまざまな予測をつなぎ合わせ、確率値を一種のヒートマップとして使用することによって生成されたオーバーレイを示しています。 「より熱い」色はより高い確率に対応し、黒はサイトが存在しないことを示します。 パレットは図 2 に見られるものと同じであり、濃い紫色は比較的低い確率 (0.5 未満) を示していることに注意してください。 透明度は、QGIS のオーバーレイ フィルターを使用して取得されます。

Maysan テストエリアの予測確率レイヤーは、QGIS 内の最上位レイヤーとして視覚化されます。 この視覚化により、ユーザーは事前定義されたしきい値に依存する代わりに、どこを見るべきかを決定できるようになります。 表示されるすべてのデータは、学術目的での地理データのフェアユース利用の条件に該当します。 関連するすべてのデータ/ソフトウェア プロバイダーのリストは次のとおりです。 (i) Microsoft Bing Maps Platform API の使用条件 (https://www.microsoft.com/en-us) のセクション 5 に基づくオリジナル マップの作成/maps/product/print-rights); (ii) QGIS (https://qgis.org/en/site/) および QuickMapsServices (https://github.com/nextgis/quickmapservices) の GNU ライセンスに基づいて、オープン ソース ソフトウェアで実現される地図表示。 (iii) 著者が開発し、(https://bit.ly/NSR_floodplains) で入手可能なソフトウェアを使用して最終的な地図を精緻化します。

残念ながら、人間による出力の評価では、しきい値の選択方法に応じて、モデルがこの領域内のサイトの約 25% ~ 30% しか正しく識別できないことがわかりました。 残りの部分には、完全に見逃されているサイト、または何らかの方法でほのめかされているサイト、または無意味に見える巨大な領域内にあるサイトのいずれかが含まれています。

このパフォーマンスの大幅な低下の理由は、地域によっては都市化が進んでおり、一般に植生が多いように見える地域の景観の性質が異なるためであると考えられます。したがって、すべての氾濫原環境が十分に類似しているわけではありません。直接の相互比較。 さらに、ウズベキスタンのデータセットの注釈の背後にある規則がメソポタミアの規則と完全に一致していない可能性があり、状況をさらに複雑にしています。

この部分的な失敗は背景に設定する必要があります。なぜなら、私たちの方法は、複数期間の決済履歴を持つアジアおよびそれ以外の幅広い同様の環境に適用できると信じているからです。ここでこの問題に対処する唯一の方法は、選択した Tepa サイトの小さなデータセットを作成し、追加ラウンドの転移学習を実行して、モデルが特定の地域の新しいコンテキストと特性を把握できるようにします。

他のセマンティック セグメンテーション アプリケーションと比較した場合、IoU メトリクスが極端に高くなくても、得られた結果は満足のいくものであると考えられます。 ただし、検出パフォーマンスをテストしたところ、このモデルがデータセット内のほとんどのサイトを依然として検出できることがわかり、調査地域の他の部分での使用に大きな期待が残りました。 ただし、ウズベキスタンのテストが示しているように、同じようなサイトがありながらコンテキストが異なる新しいエリアになると、パフォーマンスが大幅に低下する可能性があります。 考古学で呼ばれるこの移転可能性の問題は、活発な研究テーマです。 データセットが小さい場合でも、再トレーニング段階で問題が解決される可能性があり、今後の研究でこの研究の方向性が探求される可能性があります。

このタスクの評価指標が、多くの場合均一ではなく、さまざまな偽のラベルを含む注釈に対して計算されるという事実に直面すると、どのように壁にぶつかるかに注意することが重要です44。 私たちのケースでは、有用な例が提供されていない場合でも、データセットの一部である歴史的な写真や地図でのみ表示される遺跡が多数あるという事実に対処しました。 幸いなことに、このモデルは有用な概念を学習し、これらの混乱を招くデータ ポイントを無視できるほど堅牢であるようです。 さらに小さくてクリーンなデータセットであれば、計算負荷を軽減しながらパフォーマンスを大幅に向上させることができます。 明らかに、そのような清掃作業は時間の点で巨額の投資となるため、考古学者はむしろその時間を積極的に遺跡の探索に費やしたいと考えています。

しかし、私たちのモデルは、すでに調査されたエリアを自動的に調査し、手動でレビューする注釈を対照する予測リストを生成する可能性を開きます。 その後、考古学者によってよりクリーンな新しいデータセットが組み立てられ、新しく改良されたモデルがトレーニングされる可能性があります。 Lambersらを参照。 シチズンサイエンスを使用した例45。 これと同じ手順は、新しい分野への応用でも機能し、新しい予測を手動でチェックし、時間の経過とともに新しいデータセットに追加できます。

自動手順に加えて、このモデルを使用して、GIS ソフトウェア内で考古学者の目を導くオーバーレイを作成することもできます。 このグラフィカルなアプローチにより、ユーザーはオーバーレイを使用している他の地図と比較し、専門知識を利用して、持っているすべてのコンテキスト情報に基づいてサイトの存在を推測することもできます46,47。 図 4 に示すように、このアプローチは狭い領域でのみ試しましたが、出力の生成にかかる時間は 1 秒未満であり、演算を完了する必要がないため、計算を簡単に拡大して広大な領域をカバーすることができます。とにかく一発。 この方法の唯一の欠点は、異なる入力画像間の境界に明らかな不一致があり、オーバーレイがモザイク状に見えることです。 理論的には、セマンティック セグメンテーションは任意のサイズの入力で機能しますが、そのためには使用できない可能性がある大量のメモリが必要になります。 解決策としては、重複する予測マップを作成して平均化し、計算時間を犠牲にして精度を高めることが考えられます。

図 5 は、同様のソリューションの系統で、説明したモデルの使用法をまとめたものです 48,49。 モデルはデータセットから開始して、後処理を通じて操作できる予測マスクを生成し、サイトの自動評価と検出に使用できるベクター シェープファイルを取得します。 この段階で、ユーザーは予測をカットするためのしきい値を選択したり、ベクトルのぼかしやバッファリングなど、出力形状を滑らかにする技術を使用したりすることができます。 同様に、さまざまなグラフィック表現を選択して GIS ソフトウェアに直接入力することで、マップ オーバーレイを調整できます。 この場合の目標は、人間にとっては区別できるものの、確率がしきい値より低いため自動比較では検出されない可能性のあるサイトを検出することです。 いずれの方法でも、モデルが使用されるたびに、出力を確認した後、ユーザーは新しい注釈のセット、または削除または再ラベル付けされるサイトのリストを取得できます。 このようなワークフローが複数のチームによって使用される場合、調査作業が大幅にスピードアップされる可能性もあります。この場合、オープン テクノロジーを使用すると、研究グループ間で結果を共有しやすくなり、分野としての考古学に大きく役立つ可能性があります50。

私たちのモデルに基づく人間参加型のワークフロー。 モデルは注釈付きの画像からトレーニングされ、予測マスクを提供します。 マスクはオーバーレイとして使用したり、ベクトル化したりできます。 出力に対して人間による評価が行われ、モデルを改善するために洗練されたデータセットを作成できます。

CORONA 画像を使った実験は、おそらく異なるベースマップまたはそれらの組み合わせでトレーニングされた、より多くのモデルを組み合わせて、これらすべてによって得られる予測を比較する可能性も示唆しています。 特に過去の画像が存在する場合、サイトがいつ表示され、いつ検出されなくなるかについての一時的な情報も含むデータセットが作成される可能性があります。 この後者の側面は非常に斬新であり、自動化されたリモート センシングにおける潜在的なブレークスルーを表しています。 探している低い丘を強調表示するのに十分な解像度がある場合は、標高モデルの作成に立体画像を使用することもタスクに役立つ可能性があります。

私たちは、メソポタミアの氾濫原の盛り土遺跡を検出するための深層学習モデルを発表しました。 このモデルは、セマンティック セグメンテーション用の事前トレーニング済みモデルを使用して実装され、衛星画像と、約 5000 件の例を含むデータセットから取得したサイト形状のマスクに基づいて微調整されました。

私たちの実験の結果、テスト データセットで 0.8154 の IoU スコアを取得し、80% の精度でサイトを検出するモデルが得られました。 ただし、この統計の精度は、最新の衛星画像では表示されなくなったため、誤ってラベルが付けられているように見えるかなりの数のサイトに合わせて調整されています。 できる限りデータセットをクリーンアップしましたが、検出できないサイトがまだ多く残っていました。 ただし、このモデルは非常に堅牢であるようです。

この結果を受けて、考古学者が採用するワークフローを提案します。このワークフローでは、すでに確立されているリモート センシングの実践が、私たち独自のモデルの使用によってサポートおよび強化されます。 出力は、非常に高速な自動検出に使用して、これによって引き起こされる可能性のある間違いを認識したり、組み合わせてグラフィカル オーバーレイを生成してユーザーの注意を特定の領域に向けたりすることができます。 次に、モデルを使用すると、モデルの再トレーニングと改善に使用できる新しい形状ファイルと注釈が生成され、さらなる分析が可能になります。 この方法の潜在的な応用範囲は広範囲に及び、その速度に関するものだけではありません。むしろ、従来の専門家ベースの写真判読を補完する必要のあるものとして見なされるべきであり、多くの場合、見落とされがちな現場の特徴が後者に追加されます。重要であること。

論文内で提供される特定の情報に加えて、すべてのコード、データ、およびさまざまなリソースは GitHub (https://bit.ly/NSR_floodplains) で入手できます。 地理データに関しては、表示されているすべてのデータが学術目的での地理データのフェアユース利用の条件に該当します。 関連するすべてのデータ/ソフトウェア プロバイダーのリストは次のとおりです。 (i) Microsoft Bing Maps Platform API の使用条件 (https://www.microsoft.com/en-us/) のセクション 5 に基づくオリジナル マップの作成地図/製品/印刷権); (ii) QGIS (https://qgis.org/en/site/) および QuickMapsServices (https://github.com/nextgis/quickmapservices) の GNU ライセンスに基づいて、オープン ソース ソフトウェアで実現される地図表示。 (iii) 著者が開発し、(https://bit.ly/NSR_floodplains) で入手可能なソフトウェアを使用して最終的な地図を精緻化します。

Verschoof-van der Vaart, WB & Landauer, J. CarcassonNet を使用して、オランダの LiDAR データ内の空洞道路を自動的に検出して追跡します。 J.カルト。 ヘリット。 47、143–154。 https://doi.org/10.1016/j.culher.2020.10.009 (2021)。

記事 Google Scholar

Torrey, L. & Shavlik, J. 転移学習。 機械学習のアプリケーションとトレンドに関する研究ハンドブック: アルゴリズム、方法、および技術 (Torrey, L. および Shavlik, J. 編) 242–264 (IGI Global、2010)。

Google Scholar の章

Deng, J. et al. ImageNet: 大規模な階層型画像データベース。 2009 年のコンピューター ビジョンとパターン認識に関する IEEE 会議 248–255 (2009)。

Traviglia, A.、Cowley, D. & Lambers, K. 共通点の発見: 考古学的探査における人間とコンピューターの視覚。 AARGnews ニュースレット。 空中アーキオール。 解像度グループ 53、11 ~ 24 (2016)。

Google スカラー

パーマー、R. 社説。 AARGニュース(2021)。

Wilkinson, TJ、Gibson, M. & Widell, M. メソポタミアの風景モデル: 小規模プロセスが初期文明の成長にどのように貢献したか (Archaeopress、2013)。

Google Scholar を予約する

アダムズ、RM、バグダッドの背後の土地:ディヤラ平原の定住の歴史(シカゴ大学出版局、1965年)。

Google スカラー

アダムス、RM 都市の中心部: ユーフラテス川の中央氾濫原における古代の居住地と土地利用の調査 (シカゴ大学出版局、1981)。

Google スカラー

アダムス、RM & ニッセン、HJ 『ウルクの田園地帯: 都市社会の自然環境』 (シカゴ大学出版局、1972 年)。

Google スカラー

マルケッティ、N.ら。 メソポタミアにおける都市化された景観の台頭: QADIS は調査結果と多層的な歴史的景観の解釈を統合しました。 Z. アッシリアル。 ヴォルダラシアト。 アルカオル。 109、214–237。 https://doi.org/10.1515/za-2019-0016 (2019)。

記事 Google Scholar

ウィルキンソン、TJ 近東の考古学的景観 (アリゾナ大学出版局、2003 年)。

Google Scholar を予約する

ライオンズ、TR およびヒッチコック、RK 考古学における航空リモートセンシング技術 (チャコ センター、1977 年)。

Google スカラー

Kucukkaya、AG 考古学における写真測量とリモート センシング。 J.Quant. 分光器。 ラディアット。 トランスファー 88、83–88 (2004)。

記事 ADS CAS Google Scholar

Karamitrou, A.、Sturt, F.、Bogiatzis, P.、Beresford-Jones, D. 遺跡の検出のための人工知能深層学習ネットワークの使用に向けて。 サーフィン。 トポグル。 メトロル。 提案 10、044001 (2022)。

記事 ADS Google Scholar

ヘンドリックス、M.ら。 遺産の記録のためのマイクロドローンから撮影された立体画像の使用 - ロシアのアルタイにあるトゥエクタ古墳の例。 J. Archaeol. 科学。 38、2968–2978 (2011)。

記事 Google Scholar

Küçükdemirci, M. & Sarris, A. 人工知能アプローチに基づく GPR データ処理と解釈: 考古学的探査の将来の展望。 Remote Sens. 14、3377 (2022)。

記事 ADS Google Scholar

Balsi、M. et al. UAV 搭載 LIDAR による予備的な遺跡調査: ケーススタディ。 Remote Sens. 13、332 (2021)。

記事 ADS Google Scholar

Assael、Y.ら。 ディープ ニューラル ネットワークを使用した古代文書の復元と帰属。 Nature 603、280–283 (2022)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Verschoof-van der Vaart, WB、Lambers, K.、Kowalczyk, W. & Bourgeois, QP オランダの LiDAR データの大規模な考古学的探査のための深層学習と位置ベースのランキングの組み合わせ。 ISPRS インターナショナル J.Geo Inf. 9, 293 (2020)。

記事 Google Scholar

トリーア、Ø. D.、D.C.、カウリー、オーストラリア州ウォルドランド 航空レーザースキャンデータにディープニューラルネットワークを使用: スコットランド、アランの考古学的地形の半自動マッピングのケーススタディの結果。 アーキオール。 見通し。 26、165–175 (2019)。

記事 Google Scholar

Anichini、F. et al. たった 1 枚の写真からセラミックを自動認識: ArchAIDE アプリ。 J. Archaeol. 科学。 議員 36、102788 (2021)。

Google スカラー

Mantovan, L. & Nanni, L. 考古学のコンピュータ化: 人工知能技術に関する調査。 SNコンピューティング。 科学。 1、1–32 (2020)。

記事 Google Scholar

Bickler, SH 機械学習が考古学に登場します。 上級アーキオール。 練習してください。 9、186–191 (2021)。

記事 Google Scholar

Guyot, A.、Lennon, M.、Lorho, T.、Hubert-Moy, L. 深層学習アプローチを使用した、LiDAR データからの考古学的構造の検出とセグメンテーションの組み合わせ。 J.Comput. 応用アーキオール。 4、1 (2021)。

Google スカラー

トリーア、Ø. D.、サルバーグ、A.-B. & ピロ、LH ディープラーニングを使用した航空機レーザースキャンデータからの木炭窯の半自動マッピング。 CAA2016: データの海。 手順第 44 回考古学におけるコンピュータ アプリケーションと定量的手法に関する会議 219–231 (Archaeopress、2018)。

Bickler, SH & Jones, B. ディープラーニングをスケールアップして、ニュージーランド、ノースランド地方のテ・タイ・トケラウの土工現場を特定します。 考古学 16, 1 (2021)

Google スカラー

Caspari, G. & Crespo, P. 考古学的遺跡検出のための畳み込みニューラル ネットワーク - 「王子」の墓の検索。 J. Archaeol. 科学。 110、104998 (2019)。

記事 Google Scholar

オレンゴ、HA et al. マルチセンサーおよび多時点衛星データの機械学習分類を使用した、考古学的塚の自動検出。 手順国立アカド。 科学。 117、18240–18250。 https://doi.org/10.1073/pnas.2005583117 (2020)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Ronneberger, O.、Fischer, P. & Brox, T. U-net: 生物医学画像セグメンテーションのための畳み込みネットワーク。 医用画像コンピューティングとコンピュータ支援介入に関する国際会議 234–241 (Springer、2015)。

Fan, T.、Wang, G.、Li, Y. & Wang, H. MA-Net: 肝臓と腫瘍のセグメンテーションのためのマルチスケール アテンション ネットワーク。 IEEE アクセス 8、179656 ~ 179665。 https://doi.org/10.1109/ACCESS.2020.3025372 (2020)。

記事 Google Scholar

Vaswani、A. et al. 必要なのは注意力だけです。 In Advances in Neural Information Processing Systems (Vaswani, A. 他編) 5998–6008 (MIT Press、2017)。

Google スカラー

ダ・コスタ、LB 他 Sentinel-2 画像を使用してブラジル領土内のユーカリ植林地を検出するためのディープ セマンティック セグメンテーション。 ジオカルト国際空港 37、6538–6550 (2022)。

記事 Google Scholar

リー、R.ら。 高解像度のリモート センシング画像のセマンティック セグメンテーションのためのマルチアテンション ネットワーク。 IEEEトランス。 地理学。 Remote Sens. 60、1–13 (2021)。

Google スカラー

Roccetti, M. et al. 新しい遺跡を発見するための深層学習モデル設計の可能性と限界: メソポタミアの氾濫原のケース。 プロセスで。 ソーシャルグッドのためのスマートオブジェクトとテクノロジーに関する第 6 回 EAI 国際会議 216 ~ 221 (コンピューティング機械協会、2020 年)。

QGIS開発チーム。 QGIS 地理情報システム (QGIS Association、2022)。

Google スカラー

Casini, L.、Orrù, V.、Roccetti, M. & Marchetti, N. 機械が考古学者のための場所を見つけるとき: メソポタミアの氾濫原の衛星画像にセマンティック セグメンテーションを適用した予備研究。 プロセスで。 2022 年社会福祉のための情報技術に関する ACM カンファレンス 378–383 (2022)。

Casana, J. & Cothren, J. CORONA アトラス プロジェクト: CORONA 衛星画像のオルソ補正と近東における地域規模の考古学的探査。 宇宙からの考古学的景観のマッピング (Comer, DC & Harrower, MJ 編) 33–43 (Springer、2013)。

Google Scholar の章

Iakubovskii、P. セグメンテーション モデル pytorch。 GitHub リポジトリ (2019)。

マンテッリーニ S. & ベルディムラドフ AE サマルカンド (ウズベキスタン) の考古学的景観に対する人間の影響の評価: リモート センシング、現地調査、および地元の知識によるタイラック地区の通時的評価。 アーキオール。 解像度アジア 20、100143。https://doi.org/10.1016/j.ara.2019.100143 (2019)。

記事 Google Scholar

GDAL/OGR の貢献者。 GDAL/OGR 地理空間データ抽象化ソフトウェア ライブラリ (オープンソース地理空間財団、2022)。

Google スカラー

Baeza-Yates, R. & Estévez-Almenzar, M. 機械学習における人為的以外のエラーの関連性。 EBeM'22: メトリクスを超えた AI 評価に関するワークショップ (2022)。

DC、カウリー 新しいものを取り入れ、古いものを捨てる? リモートセンシング考古学の自動抽出。 海洋、海氷、沿岸水域、および大水域のリモートセンシング 2012 37–45 (SPIE、2012)。

Gallwey, J.、Eyre, M.、Tonkins, M. & Coggan, J. 月の LiDAR を地球に戻す: 深層転移学習を通じて産業遺産をマッピングする。 Remote Sens. 11、1994 年。https://doi.org/10.3390/rs11171994 (2019)。

記事 ADS Google Scholar

Fiorucci, M. et al. LiDAR での考古学的物体検出のためのディープラーニング: 新しい評価尺度と洞察。 Remote Sens. 14、1694。https://doi.org/10.3390/rs14071694 (2022)。

記事 ADS Google Scholar

Lambers, K.、Verschoof-van der Vaart, WB & Bourgeois, QPJ オランダの考古学探査におけるリモート センシング、機械学習、市民科学の統合。 Remote Sens. 11, 794. https://doi.org/10.3390/rs11070794 (2019)。

記事 ADS Google Scholar

Verschoof-van der Vaart、WB Learning to Look at LiDAR: Combining CNN-Based Object Detection and GIS for Archaeological Prospection in Remotely-Sensed Data (ライデン大学、2022)。

Google スカラー

Verschoof-van der Vaart, WB & Lambers, K. 考古学の実践における自動物体検出の適用: オランダ南部のケーススタディ。 アーキオール。 見通し。 29、15–31。 https://doi.org/10.1002/arp.1833 (2022)。

記事 Google Scholar

ヘルフォルト、B.ら。 クラウドソーシングとディープラーニングを組み合わせることで、ボランティアの労力を減らし、より正確に人間の居住地をマッピングします。 Remote Sens. 11、1799. https://doi.org/10.3390/rs11151799 (2019)。

記事 ADS Google Scholar

Ponti, M. & Seredko, A. 市民科学における人間と機械学習の統合とタスクの割り当て。 ヒューマニット。 社会科学。 共通。 9、1~15。 https://doi.org/10.1057/s41599-022-01049-z (2022)。

記事 Google Scholar

マルケッティ、N.ら。 ネアルコス。 ネットワーク化された考古学オープン サイエンス: フィールド分析と科学コミュニティの共有による考古学の進歩。 J. Archaeol. 解像度 26、447–469 (2018)。

記事 Google Scholar

リファレンスをダウンロードする

この資金は、欧州委員会 (CSOLA/2016/382-631)、フォルクスワーゲン財団 (Kalam プロジェクト)、およびトロント大学 (CRANE 2.0 プロジェクト) によって提供されました。

イタリア、ボローニャのボローニャ大学コンピュータサイエンス工学部

ルカ・カシーニ、アンドレア・モンタヌッチ、マルコ・ロケッティ

ボローニャ大学歴史文化学部、ボローニャ、イタリア

ニコロ・マルケッティ & ヴァレンティーナ・オルー

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

LC は AM で原稿を書き、設計し、実験を実行しました。 VO はデータセットと人間による評価を提供しました。 NM と MR が研究を監督し、原稿を改訂しました。

マルコ・ロッケッティへの通信。

Nicolò Marchetti は、以下のプロジェクトから資金提供を受けています。 (i) EuropeAid (CSOLA/2016/382–631)、www.eduu.unibo.it の資金提供による「EDUU—イラクの社会的結束のための教育と文化遺産の強化」プロジェクト、FloodPlains プロジェクトが開発されたフレームワーク、https://floodplains.orientlab.net/; (ii) フォルクスワーゲン財団 (www.kalam.unibo.it) の資金提供による「KALAM. ICT とコミュニティベースのアプローチを通じたイラクとウズベキスタンの考古学的景観の分析、保護、開発」プロジェクト。 (iii) トロント大学の CRANE 2.0 プロジェクト。FloodPlains が実行されている地理空間サーバーを提供しました。 他のすべての著者は競合する利益を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Casini, L.、Marchetti, N.、Montanucci, A. 他遺跡検出のための人間と AI のコラボレーション ワークフロー。 Sci Rep 13、8699 (2023)。 https://doi.org/10.1038/s41598-023-36015-5

引用をダウンロード

受信日: 2023 年 3 月 9 日

受理日: 2023 年 5 月 27 日

公開日: 2023 年 5 月 29 日

DOI: https://doi.org/10.1038/s41598-023-36015-5

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。