Семантична павутина

Матеріал з Вікіпедії — вільної енциклопедії.

Семантична павутина (англ. Semantic web) — нова концепція розвитку Всесвітньої павутини і мережі Інтернет, яка створена і впроваджується Консорціумом Всесвітньої павутини (англ. World Wide Web Consortium, W3C). Інші назви – семантична мережа, семантичний веб.

[ред.] Ціль

Семантична павутина – це надбудова над існуючою Всесвітньою павутиною, яка покликана зробити інформацію, що розміщена в мережі, більш зрозумілою для комп’ютерів. Відомо, що майже вся інформація в Інтернеті знаходиться в текстовій формі. Не секрет також, що прогрес в галузі обробки людської мови (англ. Natural Language Processing, NLP) йде дуже повільно. Комп'ютери не можуть сприйняти й осмислити словесну інформацію, розміщену в Інтернеті, і в найближчий час, мабуть, не зможуть. Тоді постає питання — як же змусити комп'ютери розуміти зміст розміщеної в мережі інформації і навчити комп'ютери користатися нею? На це питання і покликана відповісти концепція семантичної павутини. Слово «семантична» у даному випадку означає «осмислена», «зрозуміла».

[ред.] Основна ідея

В даний час комп'ютери приймають досить обмежену участь у формуванні й обробці інформації в мережі Інтернет. Важко уявити, але це так. Функції комп'ютерів в основному зводяться до збереження, відображення і пошуку інформації. У той же час створення інформації, її оцінка, класифікація й актуалізація — усе це як і раніше виконує людина. Як включити комп'ютер у ці процеси? Якщо комп'ютер поки не можна навчити розуміти людську мову, то потрібно використовувати мову, що була б зрозумілою комп'ютеру. Тобто, в ідеальному варіанті, вся інформація в Інтернеті повинна розміщуватись двома мовами: людською мовою для людини і комп'ютерною мовою для розуміння комп'ютера. Семантична павутина — це концепція мережі, у якій кожен ресурс людською мовою був би доповнений описом, зрозумілим комп'ютеру.

[ред.] Реалізація

Для створення зрозумілого комп'ютеру опису ресурсу в семантичній павутині використовується формат RDF (англ. Resource Description Framework), що заснований на синтаксисі XML і використовує ідентифікатори URI для позначення ресурсів. RDF був затверджений як стандарт W3C у лютому 2004 року. RDF — це система опису мережних ресурсів, зрозуміла комп'ютеру. Формат RDF призначений для збереження метаданних (метадані - це дані про дані). Відповідно до концепції семантичної павутини, опис у форматі RDF повинен прикріплюватися до кожного мережного ресурсу. Документи RDF повинні оброблятися комп'ютером автоматично, RDF не призначений для читання і використання людиною. На сьогодні формат RDF вже сформувався й одержав широке поширення, він служить каркасом для створення семантичної павутини.

RDFS (англ. RDF Schema) — це важлива надбудова над RDF, що дозволяє створювати класи і властивості (як в об’єктно-орієнтованому програмуванні).

Наступним важливим напрямком концепції семантичної павутини є мова OWL (англ. Web Ontology Language, вимовляється [‘оул]), що стала Рекомендацією W3C у лютому 2004 року. Ця мова побудована на форматах RDF і RDFS, вона призначена для обробки інформації в мережі. Мова OWL має 3 ступені деталізації, що є новим словом у комп'ютерних технологіях. Вона також легко масштабується й узгоджується з найсучаснішими мережними стандартами.

SPARQL (англ. Protocol And RDF Query Language, вимовляється [сп’аркл]) — нова мова запитів для швидкого доступу до даних RDF. Використовуючи звичайний протокол і мову SPARQL, програми можуть аналізувати RDF-описи ресурсів і одержувати з мережі потрібну інформацію.

ДЖЕРЕЛА:

1. Офіційний портал семантичної павутини

2. Переклад статті Тіма Бернерса-Лі, винахідника Семантичної павутини

Іншими мовами