Превращение старых карт в цифровые 3D-модели затерянных районов
Эндрю Корселли
Представьте себе, что вы надеваете гарнитуру виртуальной реальности и гуляете по давно исчезнувшему району, в котором вы выросли. Теперь это вполне реальная возможность, поскольку исследователи разработали метод создания цифровых 3D-моделей исторических кварталов с использованием машинного обучения и исторических карт Sanborn Fire Insurance.
«Дело в том, что теперь у нас есть возможность раскрыть богатство данных, заложенных в эти атласы пожаров Санборна, которые были созданы примерно для 12 000 городов и поселков в Соединенных Штатах», — сказал Харви Миллер, соавтор исследования и профессор географии. в Университете штата Огайо. «Это открывает совершенно новый подход к городским историческим исследованиям, который мы никогда не могли себе представить до появления машинного обучения. Это меняет правила игры».
Соавтор исследования Юэ Линь, докторант географии ОГУ, разработал инструменты машинного обучения, которые могут извлекать подробную информацию об отдельных зданиях с карт, включая их местоположение и площадь, количество этажей, строительные материалы и основное использование.
Исследователи протестировали свою технику машинного обучения на двух соседних кварталах в восточной части Колумбуса, штат Огайо, которые были в значительной степени разрушены в 1960-х годах, чтобы освободить место для строительства I-70. Методы машинного обучения позволили извлекать данные из карт и создавать цифровые модели.
Сравнение данных карт Санборна с сегодняшними данными показало, что в двух районах, прилегающих к шоссе, было снесено в общей сложности 380 зданий, в том числе 286 домов, 86 гаражей, пять квартир и три магазина. Анализ результатов показал, что модель машинного обучения с точностью воссоздала информацию, содержащуюся на картах, примерно на 90 процентов.
«В этом проекте мы хотим дойти до того момента, когда мы сможем раздать людям гарнитуры виртуальной реальности и позволить им ходить по улице, как это было в 1960, 1940 или, возможно, даже 1881 году», — сказал Миллер.
Вот эксклюзивное интервью Tech Briefs, отредактированное для ясности и длины, с Миллером и Лин.
Технические сводки: Можете ли вы объяснить простыми словами, как работает технология?
Миллер : Что мы делаем, так это применяем алгоритмы к данным. В этом случае мы частично используем так называемые машины опорных векторов, а также Mask R-CNN. Обычно это работает так: мы вручную отмечаем правильные ответы на картах, а затем передаем их алгоритму машинного обучения, чтобы он обучался методом проб и ошибок, с помощью положительной и отрицательной обратной связи. Когда он в конечном итоге научится обнаруживать информацию, мы сможем применить ее к данным, а затем применить к остальным картам.
Лин : На примерах карт имеется несколько типов информации. Первый тип информации — это контур здания. Если вы посмотрите на примеры карт, то увидите, что каждое здание имеет свои очертания и свои формы, а также свои цвета. Цвета представляют материалы зданий. Мы создаем модель модели опорных векторов, чтобы классифицировать каждый пиксель на основе цвета, чтобы мы могли различать фон и здания, потому что они имеют разные цвета. Именно так мы обнаруживаем очертания и формы здания для создания визуализации.
Существуют и другие типы информации, например, об использовании зданий; например, будь то магазин или жилой дом. А на примерах карт мы также сможем узнать, где находится каждое здание, потому что все они отмечены на зданиях.
В этом отношении мы отдаем предпочтение модели обнаружения под названием Mask R-CNN. Объединив эти различные фрагменты информации, мы создаем 3D-визуализацию — на основе этих исторических карт и с использованием машинного обучения.
Технические сводки: С какими самыми большими техническими проблемами вы столкнулись на протяжении всей своей работы?
Лин : часть географической привязки. Мы собрали образцы карт из Библиотеки Конгресса, и эти карты, хотя они и оцифрованы, отсканированы и раскрашены, не имеют географической привязки. Итак, нам потребовалось некоторое время, чтобы понять, как автоматически привязывать эти карты к местности — это была действительно большая проблема; это исторические карты, и часто нам не удавалось найти много контрольных точек для географической привязки.