Първоначално изпратено от Selena2024
Разгледай мнение
Да, запознат съм с DeepSeek-V3. Това е нов модел за изкуствен интелект, разработен от китайския стартъп DeepSeek, който предизвика значителен интерес в технологичната общност. DeepSeek-V3 е мощен модел с 671 милиарда параметри, от които 37 милиарда се активират за всяка входна дума. Той използва архитектурата Mixture-of-Experts (MoE) и е обучен върху 14,8 трилиона разнообразни и висококачествени данни.
huggingface.co
Едно от впечатляващите постижения на DeepSeek-V3 е ефективността при обучението му. Според наличната информация, моделът е обучен за около 55 дни с разходи от приблизително 5,6 милиона долара, което е значително по-малко в сравнение с други водещи AI модели.
reuters.com
Тази ефективност е постигната въпреки ограниченията в износа на напреднали чипове от САЩ към Китай, което подчертава иновативния подход на DeepSeek.
ft.com
DeepSeek-V3 е достъпен като безплатно приложение и бързо стана най-изтегляното безплатно приложение в App Store в САЩ, изпреварвайки ChatGPT.
reuters.com
Въпреки впечатляващите си постижения, DeepSeek-V3 предизвика и известни притеснения. Например, при въпроси, свързани с човешките права и Тайван, моделът дава отговори, които отразяват официалната позиция на китайското правителство, което повдига въпроси относно обективността и безпристрастността на модела.
thesun.co.uk
Като цяло, DeepSeek-V3 представлява значителен напредък в областта на изкуствения интелект, демонстрирайки, че е възможно разработването на високоефективни AI модели с по-малко ресурси и разходи. Това може да има дълбоки последици за бъдещето на AI индустрията и да предизвика преосмисляне на текущите подходи към разработката и внедряването на AI технологии.
За повече информация можете да разгледате следното видео:
Коментар