DeepSeek: все, что вам нужно знать о приложении чат-бота на основе искусственного интеллекта

DeepSeek стал вирусным.
Китайская лаборатория искусственного интеллекта DeepSeek ворвалась в массовое сознание на этой неделе после того, как ее приложение чат-бота поднялось на вершину чартов Apple App Store ( а также Google Play ). Модели искусственного интеллекта DeepSeek, которые были обучены с использованием эффективных вычислительных методов, заставили аналитиков Уолл-стрит и технологов усомниться в том, смогут ли США сохранить свое лидерство в гонке искусственного интеллекта и сохранится ли спрос на чипы искусственного интеллекта.
Но откуда появился DeepSeek и как он так быстро завоевал международную известность?
DeepSeek поддерживается High-Flyer Capital Management, китайским количественным хедж-фондом, который использует ИИ для принятия решений по торговле.
Энтузиаст искусственного интеллекта Лян Вэньфэн стал соучредителем High-Flyer в 2015 году. Вэньфэн, который, как сообщается, начал увлекаться трейдингом, будучи студентом Чжэцзянского университета, в 2019 году запустил High-Flyer Capital Management как хедж-фонд, сосредоточенный на разработке и внедрении алгоритмов искусственного интеллекта.
В 2023 году High-Flyer запустила DeepSeek как лабораторию, посвященную исследованию инструментов ИИ отдельно от своего финансового бизнеса. С High-Flyer в качестве одного из ее инвесторов лаборатория отделилась в собственную компанию, также названную DeepSeek.
С самого начала DeepSeek построила собственные кластеры ЦОД для обучения моделей. Но, как и другие компании ИИ в Китае, DeepSeek пострадала от запретов США на экспорт оборудования . Для обучения одной из своих последних моделей компания была вынуждена использовать чипы Nvidia H800, менее мощную версию чипа H100, доступного для американских компаний.
Говорят, что техническая команда DeepSeek состоит в основном из молодых людей. Сообщается, что компания активно набирает исследователей ИИ с докторской степенью из ведущих китайских университетов. DeepSeek также нанимает людей без какого-либо образования в области компьютерных наук , чтобы помочь своим технологиям лучше понять широкий спектр предметов, сообщает The New York Times.
DeepSeek представил свой первый набор моделей — DeepSeek Coder, DeepSeek LLM и DeepSeek Chat — в ноябре 2023 года. Но только прошлой весной, когда стартап выпустил семейство моделей следующего поколения DeepSeek-V2, индустрия ИИ начала обращать на него внимание.
DeepSeek-V2, система анализа текста и изображений общего назначения, показала хорошие результаты в различных тестах ИИ — и была намного дешевле в эксплуатации, чем сопоставимые модели того времени. Это заставило внутренних конкурентов DeepSeek, включая ByteDance и Alibaba, снизить цены на использование некоторых из своих моделей и сделать другие полностью бесплатными.
DeepSeek-V3 , запущенный в декабре 2024 года, только добавил известности DeepSeek.
Согласно результатам внутреннего тестирования DeepSeek, DeepSeek V3 превосходит как загружаемые, общедоступные модели, такие как Llama от Meta, так и «закрытые» модели, доступ к которым можно получить только через API, такие как GPT-4o от OpenAI.
Столь же впечатляющей является модель «рассуждения» R1 от DeepSeek. Выпущенная в январе, DeepSeek утверждает , что R1 работает так же хорошо, как модель o1 от OpenAI на ключевых тестах .
Будучи моделью рассуждений, R1 эффективно проверяет факты сама, что помогает ей избегать некоторых ловушек, которые обычно мешают моделям. Модели рассуждений требуют немного больше времени — обычно на секунды или минуты — для получения решений по сравнению с типичной моделью без рассуждений. Положительный момент в том, что они, как правило, более надежны в таких областях, как физика, наука и математика.
Однако у R1, DeepSeek V3 и других моделей DeepSeek есть и обратная сторона. Будучи разработанными в Китае ИИ, они подлежат сравнительному анализу со стороны китайского интернет-регулятора, чтобы гарантировать, что их ответы «воплощают основные социалистические ценности». Например, в приложении чат-бота DeepSeek R1 не будет отвечать на вопросы о площади Тяньаньмэнь или автономии Тайваня.
Если у DeepSeek есть бизнес-модель, то неясно, что это за модель. Компания устанавливает цены на свои продукты и услуги значительно ниже рыночной стоимости — и раздает другие бесплатно.
Как сообщает DeepSeek, прорывы в эффективности позволили ей поддерживать экстремальную конкурентоспособность по стоимости. Однако некоторые эксперты оспаривают цифры, предоставленные компанией.
Как бы то ни было, разработчики взяли на вооружение модели DeepSeek, которые не являются моделями с открытым исходным кодом в общепринятом понимании, но доступны по разрешительным лицензиям, которые допускают коммерческое использование. По словам Клема Деланга, генерального директора Hugging Face, одной из платформ, размещающих модели DeepSeek, разработчики Hugging Face создали более 500 «производных» моделей R1 , которые в общей сложности набрали 2,5 миллиона загрузок.
Успех DeepSeek в сравнении с более крупными и авторитетными конкурентами был описан как «переворачивающий ИИ» и «чрезмерно разрекламированный». Успех компании, по крайней мере, частично стал причиной падения стоимости акций Nvidia на 18% в понедельник и вызвал публичную реакцию генерального директора OpenAI Сэма Альтмана.
Microsoft объявила, что DeepSeek доступен на ее сервисе Azure AI Foundry , платформе Microsoft, которая объединяет службы ИИ для предприятий под одним знаменем. Когда генерального директора Марка Цукерберга спросили о влиянии DeepSeek на расходы Meta на ИИ во время отчета о доходах за первый квартал, он сказал, что расходы на инфраструктуру ИИ по-прежнему будут «стратегическим преимуществом» для Meta.
В то же время некоторые компании запрещают DeepSeek , а также целые страны и правительства , включая Южную Корею . Штат Нью-Йорк также запретил использование DeepSeek на правительственных устройствах .
Что касается будущего DeepSeek, то оно неясно. Улучшенные модели — это само собой разумеется. Но правительство США, похоже, все больше опасается того, что оно воспринимает как вредоносное иностранное влияние .
У TechCrunch есть рассылка, посвященная ИИ! Подпишитесь здесь, чтобы получать ее на свой почтовый ящик каждую среду.
Эта история была первоначально опубликована 28 января 2025 года и будет постоянно обновляться новой информацией.
techcrunch