М.В. Мальков
ТЕХНОЛОГИИ СЕМАНТИЧЕСКОЙ СЕТИ И ДИСТАНЦИОННОЕ ОБУЧЕНИЕ
Институт информатики и математического моделирования технологических
процессов Кольского научного центра РАН (ИИММТП КНЦ РАН)
В данном кратком обзоре рассмотрены основные технологии и особенности дистанционного обучения в семантической сети.
Текущее состояние сети Интернет характеризуется слабой структурированностью данных и, практически, отсутствием их взаимосвязи. Несмотря на наличие множества всевозможных способов поиска информации, ее извлечения и доставки, отыскать нужную информацию в Web с каждым днем становится все труднее. Современные Web-технологии поиска основаны на полнотекстовом поиске. Все поисковые запросы обслуживаются на основе индекса, содержащего некоторые описания вхождений слов (термов) из известных данной поисковой системе документов. Для сбора сведений о доступных документах, которые потом используются для построения индекса, применяются так называемые сетевые роботы - программы, которые, начиная с некоторой Web-страницы, рекурсивно обходят ресурсы Интернет, извлекая ссылки на новые ресурсы из получаемых документов. При этом возникают различные проблемы – выбора того, что следует индексировать, обеспечения равноправного индексирования всего информационного пространства, а также решения, в контексте каких поисковых запросов следует выдавать ту или иную информацию. Из-за размеров информационного Web-пространства индексы получаются очень большими, индексируется при этом лишь часть Web-пространства, требуются вычислительно трудоемкие методы работы с индексами, результаты поиска содержат много несоответствующей интересам пользователя информации. Т.е. проблема поиска информации в настоящее время указанными средствами не решена. Так, например, возникают проблемы при интеграции и сравнении информации, когда невозможно определить, что конкретно содержится в документе.
Следует подчеркнуть, что в настоящее время компьютеры принимают довольно ограниченное участие в формировании и обработке информации в сети Интернет. Функции компьютеров в основном сводятся к хранению, отображению и поиску информации. В то же время создание информации, её оценку, классификацию и актуализацию — всё это по-прежнему выполняет человек. Как включить компьютер в эти процессы? Если компьютер пока нельзя научить понимать человеческий язык, то нужно использовать язык, который был бы понятен компьютеру. То есть, в идеальном варианте вся информация в Интернете должна размещаться на двух языках: на человеческом языке для человека и на компьютерном языке для понимания компьютера. Эта задача должна быть решена в семантической сети. Слово «семантическая» в данном случае означает «осмысленная», «понятная». Таким образом, семантическая сеть (Semantic Web) — это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру.
На сегодняшний день для решения проблем поиска, выбора и обработки информации, представляется целесообразным использование технологий семантической сети, потому что Semantic Web предполагает наличие у любой информации, находящейся в сети, связанный с этой информацией точный смысл, который нельзя было бы перепутать даже в случае совпадения фраз или слов, встреченных в разных контекстах. Фактически это означает, что любая информация связывается с некоторым неотделимым от нее контекстом.
Полный вариант статьи вы можете заказать за 50 руб.
Варианты оплаты