розмічування частин мови (англ. part-of-speech tagging, POS tagging, POST), також називається граматичним позначенням або розбором на частини мови, це...
44 KB (2,997 words) - 07:26, 2 May 2024
Apache OpenNLP (category Обробка природної мови)
природної мови (ОПМ). Підтримуються найпоширеніші завдання ОПМ, такі як визначення мови, токенізація, сегментація речень, розмічування частин мови, розпізнавання...
3 KB (109 words) - 15:21, 27 December 2024
SpaCy (category Інструментарії обробки природної мови)
як бекенд, spaCy пропонує моделі згорткових нейронних мереж для розмічування частин мови, розбору залежностей, категоризації тексту та розпізнавання іменованих...
12 KB (706 words) - 20:15, 11 February 2024
послідовностями тексту). Задача розмічування послідовностей з'являється під кількома личинами, такими як розмічування частин мови та розпізнавання іменованих...
12 KB (731 words) - 14:56, 8 June 2024
Поверхнево-синтаксичний аналіз (category Обробка природної мови)
Демонстрація поверхневого аналізатора Illinois Shallow Parser Синтаксичний аналізатор Розмічування семантичних ролей[en] Розпізнавання іменованих сутностей...
5 KB (264 words) - 23:12, 17 August 2022
Витягування відкритої інформації[en] Розмічування частин мови Розпізнавання мовлення Шимко, Віталій (2019). Розуміння природної мови: методологічна концептуалізація...
30 KB (2,061 words) - 18:23, 17 May 2024
автоматичного виділення термінів використовують засоби обробки мови (розмічування частин мови, виокремлення фраз), за допомогою яких визначають термінологічні...
12 KB (893 words) - 11:53, 31 August 2024
мови, особливо в тих, що породжують текст як вихід. Моделювання мов використовують у розпізнаванні мовлення, машиннім перекладі, розмічуванні частин мови...
36 KB (2,923 words) - 20:14, 11 February 2024
Ідентифікація мови (англ. language identification), в методиці обробки природної мови — визначення мови. Проблема ідентифікації мови є особливим випадком...
17 KB (1,155 words) - 10:45, 8 April 2023
комп'ютерного аналізу та синтезу природної мови. Стосовно штучного інтелекту аналіз означає розуміння мови, а синтез — генерацію розумного тексту. Розв'язок...
31 KB (2,028 words) - 20:04, 11 February 2024
Термін «розмітка» (markup) виник з традиційної видавничої практики розмічування (marking up) рукописів, шляхом додавання символьних позначок на їхні...
25 KB (1,784 words) - 16:09, 24 April 2024
баченні. Зокрема, УВП, серед інших задач, знаходять застосування в розмічуванні частин мови, поверхнево-синтаксичному аналізі, розпізнаванні іменованих сутностей...
33 KB (2,252 words) - 15:32, 16 November 2024
позначки. Але з 1725 року зафіксовано також значення «інструмент для розмічування», а з 1951 під ним розуміється конкретно інструмент для виділення тексту...
4 KB (275 words) - 20:45, 30 December 2024
Розпізнавання рукописного введення Прогноз структури протеїну Розмічування частин мови Синтаксичний аналіз залежностей Видобуток сутностей Штучна нейронна...
8 KB (621 words) - 23:18, 1 August 2023
Триграма (category Обробка природної мови)
n-грами, де n дорівнює 3. Вони часто використовуються в обробці природної мови для виконання статистичного аналізу текстів і в криптографії для контролю...
5 KB (289 words) - 15:00, 15 November 2024
задач розуміння природної мови: Наборі задач GLUE (англ. General Language Understanding Evaluation, загальна оцінка розуміння мови, що складається з 9 задач)...
17 KB (1,254 words) - 20:11, 11 February 2024
Natural Language Toolkit (category Статистична обробка природної мови)
природної мови, або частіше NLTK, — це набір бібліотек і програм для символьної та статистичної обробки природної мови (NLP) для англійської мови, написаних...
7 KB (319 words) - 19:19, 24 May 2024
Вкладання слів (category Обробка природної мови)
багатосенсових вкладень покращує продуктивність в низці задач ОПМ, таких як розмічування частин мови, ідентифікація семантичних відношень, та семантична пов'язаність[en]...
31 KB (2,204 words) - 18:54, 23 April 2024
Терм-документна матриця (category Обробка природної мови)
них є схема TF-IDF. Такі матриці використовуються при обробці природної мови, зокрема в методах латентно-семантичного аналізу. При створенні бази даних...
3 KB (198 words) - 08:27, 31 March 2023
Спрощення тексту (category Обробка природної мови)
Спрощення тексту є важливою сферою досліджень, оскільки природні людські мови зазвичай містять великі словникові запаси та складні конструкції, які не...
7 KB (458 words) - 01:01, 31 March 2022
Латентно-семантичний аналіз (category Обробка природної мови)
Лате́нтно-семанти́чний ана́ліз (ЛСА) — метод обробки інформації природною мовою, зокрема, дистрибутивної семантики, що дозволяє аналізувати взаємозв'язок...
4 KB (242 words) - 07:28, 14 December 2024
Інтелектуальний аналіз тексту (category Обробка природної мови)
багато інших застосовують більш широку обробку природної мови, таку як розмічування частин мови (англ. Part-of-speech tagging), синтаксичний аналіз та інші...
59 KB (4,161 words) - 13:39, 1 December 2024
Біграми (category Формальні мови)
аналіз) Частоти біграм є одним з підходів до статистичної ідентифікації мови. Біграми допомагають отримати умовну ймовірність символу з урахуванням попереднього...
8 KB (518 words) - 18:53, 10 August 2023
Видобування інформації (category Обробка природної мови)
випадків ця діяльність стосується обробки текстів людською мовою за допомогою обробки природної мови (ОПМ, англ. NLP). Останні дії в мультимедіа обробці документів...
27 KB (1,838 words) - 01:31, 1 May 2024
Розрізнення меж речення (category Обробка природної мови)
виявлення меж речення і сегментація речення – задача в галузі обробки природної мови, яка визначає місце початку й закінчення речення. Інструменти обробки тексту...
7 KB (419 words) - 22:20, 21 August 2024
Модель «торба слів» (category Обробка природної мови)
Гешування ознак[en] Машинне навчання MinHash[en] N-грам Обробка природної мови Векторна модель w-shingling Sivic, Josef (April 2009). Efficient visual search...
17 KB (1,176 words) - 18:16, 12 August 2024
Велика мовна модель (category Обробка природної мови)
Велика мовна модель або велика модель мови (ВММ або LLM від англ. large language model) — це модель мови, що складається з нейронної мережі з багатьма...
10 KB (651 words) - 00:49, 14 June 2024
Word2vec (category Інструментарії обробки природної мови)
Word2vec — це одна з методик обробки природної мови. Алгоритм word2vec використовує нейромережну модель для навчання пов'язаностей слів із великого корпусу...
32 KB (2,090 words) - 05:30, 5 December 2023
GPT-4 (Generative Pre-trained Transformer 4) — мультимодальна велика модель мови, створена компанією OpenAI, четверта в серії GPT. Випущена 14 березня 2023...
13 KB (909 words) - 20:55, 27 December 2024
Розпізнавання іменованих сутностей (category Обробка природної мови)
компанії з двох токенів та часового виразу. Сучасні системи РІС для англійської мови показують продуктивність близьку до людської. Наприклад, найкраща система...
31 KB (2,088 words) - 00:44, 26 August 2023
Прихована марковська модель (category Статті з прикладами коду мовою Python)
однієї молекули Криптоаналіз Розпізнавання мовлення Синтез мовлення Розмічування частин мови Розділення документів у рішеннях для сканування Машинний переклад...
96 KB (5,552 words) - 17:51, 23 April 2024