Компютърна лингвистика
от Уикипедия, свободната енциклопедия
| Лингвистика |
| Теоретична лингвистика |
| Лингвистични методи |
| Същност на езика |
| Езикът като знакова система |
| Езикът като система |
| Фонетика |
| Говорен апарат |
| Артикулационна фонетика |
| Гласни звукове |
| Съгласни звукове |
| Фонетична акустика |
| Гласни звукове |
| Съгласни звукове |
| Фонетично членение на речта |
| Фонология |
| Фонема |
| Позиция на фонемата |
| Опозиция на фонемата |
| Дистрибуция на фонемата |
| Звукови промени |
| Фонетични промени |
| Нефонетични промени |
| Морфология |
| Синтаксис |
| Семантика |
| Лексикална семантика |
| Стуктурална семантика |
| Стилистика |
| Диалектология |
| Приложна лингвистика |
| Психолингвистика |
| Социолингвистика |
| Генеративна лингвистика |
| Когнитивно лингвистика |
| Компютърна лингвистика |
| Дескриптивна лингвистика |
| Историческа лингвистика |
| Компаративна лингвистика |
| Етимология |
| История на лингвистиката |
| Лингвистични школи |
| Известни лингвисти |
| Нерешени проблеми |
Компютърната лингвистика е теоретико-приложна наука, дял от изкуствения интелект, която се занимава с използването на компютърните технологии при обработката на естествен език.
Съдържание |
[редактиране] Дялове
Основни дялове на компютърната лингвистика са:
- автоматичен анализ на текстове
- генериране на текстове
- анализ и синтез на реч
[редактиране] Приложение
[редактиране] Автоматичен анализ на текстове
Приложението на автоматичния анализ е в области като машинен превод, интелигентно търсене на информация и автоматично отговаряне на въпроси. Генерирането на текстове има приложение при интелигентните интерфейси. Обработката на реч се използва при комуникация с компютърни устройства с гласови команди, например управление на автомобил с глас.
Автоматичният анализ на текстове се провежда на различни нива: разделяне текста на лексеми, морфология|морфологичен анализ, синтактичен анализ, анализ на дискурсните феномени като местоименни и неместоименни анафори, елипси и др.
Различните нива на анализ използват различни програми: морфологични анализатори, синтактични анализатори /parsers/, разрешители на анафори, анализатори на реторичната структура.
Текущото състояние на автоматичния текстов анализ позволява сравнително надежден морфологичен анализ /до 99% точност/, не дотам точен синтактичен анализ /80-85%/ и твърде неточно разрешаване на анафори /70-80%/. Съществуват и разработки за привеждане на текста в логическа форма.
При автоматичния анализ на текстове се използват ресурси, в които е зададено знанието за езика. Такива ресурси са морфологичните речници, граматиките, онтологиите, честотни таблици, информация за синтактичните рамки на глаголите и др.
Друг източник на знания са колекциите от текстове в електронен формат /корпуси/, от които знанията се извличат чрез статистически техники. Този дял от компютърната лингвистика е познат като корпусна лингвистика.
[редактиране] Генериране на текстове
Генерирането на текст е противоположно на анализа. Програмите за генерация започват от някакъв модел на смисъла и конструират лингвистичното му представяне.
[редактиране] Анализ и синтез на реч
Обработката на реч използва статистически техники за да се превърнат гласовите команди в текст.

