• розмічування частин мови (англ. part-of-speech tagging, POS tagging, POST), також називається граматичним позначенням або розбором на частини мови, це...
    44 KB (2,997 words) - 07:26, 2 May 2024
  • Apache OpenNLP (category Обробка природної мови)
    природної мови (ОПМ). Підтримуються найпоширеніші завдання ОПМ, такі як визначення мови, токенізація, сегментація речень, розмічування частин мови, розпізнавання...
    3 KB (109 words) - 15:21, 27 December 2024
  • SpaCy (category Інструментарії обробки природної мови)
    як бекенд, spaCy пропонує моделі згорткових нейронних мереж для розмічування частин мови, розбору залежностей, категоризації тексту та розпізнавання іменованих...
    12 KB (706 words) - 20:15, 11 February 2024
  • послідовностями тексту). Задача розмічування послідовностей з'являється під кількома личинами, такими як розмічування частин мови та розпізнавання іменованих...
    12 KB (731 words) - 14:56, 8 June 2024
  • Поверхнево-синтаксичний аналіз (category Обробка природної мови)
    Демонстрація поверхневого аналізатора Illinois Shallow Parser Синтаксичний аналізатор Розмічування семантичних ролей[en] Розпізнавання іменованих сутностей...
    5 KB (264 words) - 23:12, 17 August 2022
  • Витягування відкритої інформації[en] Розмічування частин мови Розпізнавання мовлення Шимко, Віталій (2019). Розуміння природної мови: методологічна концептуалізація...
    30 KB (2,061 words) - 18:23, 17 May 2024
  • автоматичного виділення термінів використовують засоби обробки мови (розмічування частин мови, виокремлення фраз), за допомогою яких визначають термінологічні...
    12 KB (893 words) - 11:53, 31 August 2024
  • мови, особливо в тих, що породжують текст як вихід. Моделювання мов використовують у розпізнаванні мовлення, машиннім перекладі, розмічуванні частин мови...
    36 KB (2,923 words) - 20:14, 11 February 2024
  • Ідентифікація мови (англ. language identification), в методиці обробки природної мови — визначення мови. Проблема ідентифікації мови є особливим випадком...
    17 KB (1,155 words) - 10:45, 8 April 2023
  • комп'ютерного аналізу та синтезу природної мови. Стосовно штучного інтелекту аналіз означає розуміння мови, а синтез — генерацію розумного тексту. Розв'язок...
    31 KB (2,028 words) - 20:04, 11 February 2024
  • Термін «розмітка» (markup) виник з традиційної видавничої практики розмічування (marking up) рукописів, шляхом додавання символьних позначок на їхні...
    25 KB (1,784 words) - 16:09, 24 April 2024
  • баченні. Зокрема, УВП, серед інших задач, знаходять застосування в розмічуванні частин мови, поверхнево-синтаксичному аналізі, розпізнаванні іменованих сутностей...
    33 KB (2,252 words) - 15:32, 16 November 2024
  • позначки. Але з 1725 року зафіксовано також значення «інструмент для розмічування», а з 1951 під ним розуміється конкретно інструмент для виділення тексту...
    4 KB (275 words) - 20:45, 30 December 2024
  • Розпізнавання рукописного введення Прогноз структури протеїну Розмічування частин мови Синтаксичний аналіз залежностей Видобуток сутностей Штучна нейронна...
    8 KB (621 words) - 23:18, 1 August 2023
  • Триграма (category Обробка природної мови)
    n-грами, де n дорівнює 3. Вони часто використовуються в обробці природної мови для виконання статистичного аналізу текстів і в криптографії для контролю...
    5 KB (289 words) - 15:00, 15 November 2024
  • задач розуміння природної мови: Наборі задач GLUE (англ. General Language Understanding Evaluation, загальна оцінка розуміння мови, що складається з 9 задач)...
    17 KB (1,254 words) - 20:11, 11 February 2024
  • Natural Language Toolkit (category Статистична обробка природної мови)
    природної мови, або частіше NLTK, — це набір бібліотек і програм для символьної та статистичної обробки природної мови (NLP) для англійської мови, написаних...
    7 KB (319 words) - 19:19, 24 May 2024
  • Вкладання слів (category Обробка природної мови)
    багатосенсових вкладень покращує продуктивність в низці задач ОПМ, таких як розмічування частин мови, ідентифікація семантичних відношень, та семантична пов'язаність[en]...
    31 KB (2,204 words) - 18:54, 23 April 2024
  • Терм-документна матриця (category Обробка природної мови)
    них є схема TF-IDF. Такі матриці використовуються при обробці природної мови, зокрема в методах латентно-семантичного аналізу. При створенні бази даних...
    3 KB (198 words) - 08:27, 31 March 2023
  • Спрощення тексту (category Обробка природної мови)
    Спрощення тексту є важливою сферою досліджень, оскільки природні людські мови зазвичай містять великі словникові запаси та складні  конструкції, які не...
    7 KB (458 words) - 01:01, 31 March 2022
  • Латентно-семантичний аналіз (category Обробка природної мови)
    Лате́нтно-семанти́чний ана́ліз (ЛСА) — метод обробки інформації природною мовою, зокрема, дистрибутивної семантики, що дозволяє аналізувати взаємозв'язок...
    4 KB (242 words) - 07:28, 14 December 2024
  • Інтелектуальний аналіз тексту (category Обробка природної мови)
    багато інших застосовують більш широку обробку природної мови, таку як розмічування частин мови (англ. Part-of-speech tagging), синтаксичний аналіз та інші...
    59 KB (4,161 words) - 13:39, 1 December 2024
  • Біграми (category Формальні мови)
    аналіз) Частоти біграм є одним з підходів до статистичної ідентифікації мови. Біграми допомагають отримати умовну ймовірність символу з урахуванням попереднього...
    8 KB (518 words) - 18:53, 10 August 2023
  • Видобування інформації (category Обробка природної мови)
    випадків ця діяльність стосується обробки текстів людською мовою за допомогою обробки природної мови (ОПМ, англ. NLP). Останні дії в мультимедіа обробці документів...
    27 KB (1,838 words) - 01:31, 1 May 2024
  • Розрізнення меж речення (category Обробка природної мови)
    виявлення меж речення і сегментація речення  – задача в галузі обробки природної мови, яка визначає місце початку й закінчення речення. Інструменти обробки тексту...
    7 KB (419 words) - 22:20, 21 August 2024
  • Модель «торба слів» (category Обробка природної мови)
    Гешування ознак[en] Машинне навчання MinHash[en] N-грам Обробка природної мови Векторна модель w-shingling Sivic, Josef (April 2009). Efficient visual search...
    17 KB (1,176 words) - 18:16, 12 August 2024
  • Велика мовна модель (category Обробка природної мови)
    Велика мовна модель або велика модель мови (ВММ або LLM від англ. large language model) — це модель мови, що складається з нейронної мережі з багатьма...
    10 KB (651 words) - 00:49, 14 June 2024
  • Word2vec (category Інструментарії обробки природної мови)
    Word2vec — це одна з методик обробки природної мови. Алгоритм word2vec використовує нейромережну модель для навчання пов'язаностей слів із великого корпусу...
    32 KB (2,090 words) - 05:30, 5 December 2023
  • GPT-4 (Generative Pre-trained Transformer 4) — мультимодальна велика модель мови, створена компанією OpenAI, четверта в серії GPT. Випущена 14 березня 2023...
    13 KB (909 words) - 20:55, 27 December 2024
  • Розпізнавання іменованих сутностей (category Обробка природної мови)
    компанії з двох токенів та часового виразу. Сучасні системи РІС для англійської мови показують продуктивність близьку до людської. Наприклад, найкраща система...
    31 KB (2,088 words) - 00:44, 26 August 2023
  • Прихована марковська модель (category Статті з прикладами коду мовою Python)
    однієї молекули Криптоаналіз Розпізнавання мовлення Синтез мовлення Розмічування частин мови Розділення документів у рішеннях для сканування Машинний переклад...
    96 KB (5,552 words) - 17:51, 23 April 2024