Qwen — Википедия
Qwen | |
---|---|
![]() | |
Тип | Генеративный искусственный интеллект, Большая языковая модель |
Разработчик | Alibaba Cloud |
Операционная система | Кроссплатформенный |
Языки интерфейса | Многоязычный (29+ языков) |
Первый выпуск | 2024 |
Последняя версия | 2.5 |
Лицензия | Open-source (Apache 2.0) |
Сайт | qwen-ai.com |
Qwen (также называемая Tongyi Qianwen, кит. упр. 通义千问) — семейство больших языковых моделей, разработанных Alibaba. В июле 2024 года модель была признана лучшей китайскоязычной моделью по некоторым тестам и заняла третье место в мире после топ-моделей Anthropic и OpenAI. Qwen является частью семейства моделей, которые конкурируют с другими крупными языковыми моделями, такими как GPT от OpenAI и PaLM от Google.
Последняя версия Qwen — Qwen 2.5 — это передовая языковая модель, разработанная для решения широкого спектра задач в области искусственного интеллекта. Она выделяется способностью к генерации кода, многозадачностью и поддержкой более 29 языков, что делает её универсальным инструментом для различных отраслей, включая разработку ПО, анализ данных и образование[1].
История модели
[править | править код]Alibaba впервые представила бета-версию Qwen в апреле 2023 года под названием Tongyi Qianwen[2]. Модель была основана на LLM LLaMA, разработанной Meta AI, с различными модификациями. Она была публично выпущена в сентябре 2023 года после получения одобрения со стороны китайского правительства. В декабре 2023 года компания выпустила в открытый доступ модели 72B и 1.8B, а Qwen 7B была открыта в августе[3].
В июне 2024 года Alibaba запустила Qwen 2, а в сентябре выпустила некоторые её модели в открытый код, сохранив при этом самые передовые версии закрытыми[4]. Qwen 2 использует модель Смешение экспертов[5].
В ноябре 2024 года была выпущена QwQ-32B-Preview — модель, ориентированная на логические рассуждения, аналогичная o1 от OpenAI. Она была выпущена под лицензией Apache 2.0, но при этом были обнародованы только веса, без датасета и метода обучения.[6][7] QwQ имеет контекстную длину в 32 000 токенов и превосходит o1 по некоторым тестам[8].
Серия Qwen-VL представляет собой линейку визуально-языковых моделей, которые объединяют трансформер визуального восприятия с LLM[9]. Alibaba выпустила Qwen-VL2 с вариантами на 2 и 7 миллиардов параметров. Флагманской моделью компании в области компьютерного зрения является Qwen-vl-max, которая продаётся через Alibaba Cloud по цене 0,00041 доллара США за тысячу входных токенов[10].
Alibaba также выпустила несколько других типов моделей, таких как Qwen-Audio и Qwen2-Math[11]. Всего компания открыла исходный код более 100 моделей, а их модели были загружены более 40 миллионов раз[12]. Энтузиастами были разработаны дообученные версии Qwen, такие как «Liberated Qwen», созданная компанией Abacus AI из Сан-Франциско. Эта версия позволяет отвечать на любые запросы без ограничений на содержание[13].
Возможности
[править | править код]- Обширная база знаний — модель обучена на 18 триллионах токенов, что обеспечивает глубокое понимание контекста и позволяет интерпретировать сложные запросы[14].
- Расширенные окна контекста — Обработка данных до 128 000 токенов позволяет работать с большими документами и сложными задачами[15].
- Продвинутая генерация кода — вариант модели Qwen2.5-Coder предназначен для написания, анализа и оптимизации программного кода[16].
- Многоязычная поддержка — более 29 языков, включая английский, китайский, французский, испанский и другие[17].
- Улучшенные математические способности — специализированная версия Qwen2.5-Math справляется с многошаговыми вычислениями и аналитическими задачами[18].
- Высокая производительность: Модель оптимизирована для работы в облачной среде, что позволяет ей быстро обрабатывать запросы даже при больших нагрузках.
- Интеграция с облачными сервисами: Qwen легко интегрируется с другими продуктами Alibaba Cloud, что делает её удобным инструментом для разработчиков.
Применение
[править | править код]- Разработка программного обеспечения — автоматическая генерация кода, отладка, документация.
- Анализ данных — обработка больших наборов данных, математические вычисления, отчёты.
- Образование — создание учебных материалов, помощь в исследовательских работах.
- Бизнес — оптимизация процессов, взаимодействие с клиентами, бизнес-аналитика[19].
- Маркетинг: генерация текстов для рекламных кампаний.
См. также
[править | править код]Ссылки
[править | править код]Примечания
[править | править код]- ↑ Qwen 2.5 Overview . Alibaba Cloud. Дата обращения: 29 января 2025.
- ↑ Chiang, Sheila. Alibaba to roll out its rival to ChatGPT across all its products (англ.). CNBC (11 апреля 2023).
- ↑ Jiang, Ben. Alibaba opens Tongyi Qianwen model to public as new CEO embraces AI (англ.). South China Morning Post (13 сентября 2023).
- ↑ Jiang, Ben. Alibaba says new AI model Qwen2 bests Meta's Llama 3 in tasks like maths and coding (англ.). South China Morning Post (7 июня 2024).
- ↑ Yang, An; et al. (2024-09-10). "Qwen2 Technical Report". arXiv:2407.10671 [cs.CL].
- ↑ Franzen, Carl. Alibaba claims no. 1 spot in AI math models with Qwen2-Math . VentureBeat (8 августа 2024).
- ↑ 故渊. 阿里通义千问 QwQ 登场:开源 AI 推理新王,MATH 测试超 OpenAI o1 模型 - IT之家 . www.ithome.com (28 ноября 2024).
- ↑ Wiggers, Kyle. Alibaba releases an 'open' challenger to OpenAI's o1 reasoning model . TechCrunch (27 ноября 2024).
- ↑ Bai, Jinze; et al. (2023-09-28). "Qwen Technical Report". arXiv:2309.16609 [cs.CL].
- ↑ Jiang, Ben. Alibaba's open-source AI model tops Chinese rivals, ranks 3rd globally (англ.). South China Morning Post (11 июля 2024).
- ↑ Dickson, Ben. Alibaba releases Qwen with Questions, an open reasoning model that beats o1-preview . VentureBeat (29 ноября 2024).
- ↑ Kharpal, Arjun. China's Alibaba launches over 100 new open-source AI models, releases text-to-video generation tool (англ.). CNBC (19 сентября 2024).
- ↑ Mims, Christopher. Here Come the Anti-Woke AIs . WSJ (19 апреля 2024).
- ↑ Qwen 2.5 Training Data . Alibaba Cloud. Дата обращения: 29 января 2025.
- ↑ Qwen 2.5 Context Length . Alibaba Cloud. Дата обращения: 29 января 2025.
- ↑ Qwen 2.5 Coding Capabilities . Alibaba Cloud. Дата обращения: 29 января 2025.
- ↑ Qwen 2.5 Multilingual Support . Alibaba Cloud. Дата обращения: 29 января 2025.
- ↑ Qwen 2.5 Math Capabilities . Alibaba Cloud. Дата обращения: 29 января 2025.
- ↑ Qwen 2.5 Use Cases . Alibaba Cloud. Дата обращения: 29 января 2025.