Новости

Новая модель ИИ DeepSeek будет способна функционировать на одном GPU.

Китайская ИИ-лаборатория DeepSeek представила обновленную «рассуждающую» модель R1. Ее облегчённая версия способна работать на одной видеокарте.

DeepSeek-R1-0528-Qwen3-8B основана на базе Qwen3-8B, которую Alibaba представила в мае. По данным компании, эта модель превзошла Google Gemini 2.5 Flash в тестах AIME 2025 — сборнике сложных математических задач.

«Дистиллированная» версия — это упрощённый и ускоренный вариант крупной модели машинного обучения, созданный с помощью метода дистилляции знаний. Такие нейросети обычно уступают в мощности, но значительно экономят вычислительные ресурсы.

Согласно информации от NodeShift, Qwen3-8B требует графический процессор с 40-80 Гб видеопамяти и может работать на одной Nvidia H100.

DeepSeek применяла обновлённые R1 и Qwen3-8B для обучения и настройки DeepSeek-R1-0528-Qwen3-8B.

Новая версия основной модели R1 получила лишь незначительные изменения, сообщают разработчики. Она доступна на платформе Hugging Face.

Разработчик с ником xlr8harder заметил, что модель стала меньше обсуждать спорные темы, особенно касающиеся китайского правительства.

Он критически отметил: «DeepSeek сделала шаг назад в плане свободы слова. Однако благодаря открытому исходному коду с разрешительной лицензией сообщество сможет и будет работать над исправлением этой ситуации».

В одном из примеров модель признала факт существования лагерей для интернированных в Синьцзяне, но отказалась критиковать действия китайских властей.

xlr8harder отметил: «Интересно, хотя и ожидаемо, что модель приводит эти лагеря как пример нарушения прав человека, но при прямом вопросе отказывается это подтверждать».

Напомним, что в апреле DeepSeek выпустила открытую математически ориентированную ИИ-модель Prover.

Яковенко Илья

Recent Posts

По мнению QCP, биткоин укрепит позиции на фоне мировой неопределенности

Аналитики QCP Capital заявили, что, несмотря на рост геополитической напряженности на Ближнем Востоке, инвесторы в…

19 часов ago

За неделю в криптофонды вложили $1,9 млрд

Несмотря на напряжённую обстановку в мире, связанную с эскалацией конфликта между Ираном и Израилем, интерес…

19 часов ago

Главное за неделю: крипторынок остался стабильным, а Мосбиржа представила индекс на биткоин

Несмотря на геополитическую нестабильность и макроэкономические риски, крипторынок сохранил ключевые ценовые уровни. Среди значимых событий…

2 дня ago

Вьетнам узаконил использование цифровых активов.

14 июня 2025 года Национальное собрание Вьетнама одобрило «Закон об индустрии цифровых технологий», который устанавливает…

2 дня ago

Обзор IceRiver: лучшие ASIC-майнеры для Kaspa в 2025 году

Что такое IceRiver? IceRiver — это линейка специализированных ASIC-устройств, разработанных исключительно для майнинга криптовалюты Kaspa…

2 дня ago

Hashcore Toolkit: лучший инструмент для управления ASIC в 2025 году

Особенности Hashcore Toolkit: Hashcore Toolkit — это мощная утилита от команды Vnish, предназначенная для удобного…

3 дня ago