近日,國產(chǎn)AI DeepSeek在中國、美國的科技圈受到廣泛關注,甚至被認為是大模型行業(yè)的最大“黑馬”,在外網(wǎng),DeepSeek被不少人稱為“神秘的東方力量”。
1月27日,蘋果App Store中國區(qū)免費榜顯示,DeepSeek成為中國區(qū)第一。
此前,DeepSeek在美區(qū)蘋果App Store的免費排行榜中飆升至第四,排行第一仍是ChatGPT。
1月26日,游戲科學創(chuàng)始人、CEO,《黑神話:悟空》制作人馮驥評價DeepSeek:可能是個國運級別的科技成果。
馮驥表示:“希望DeepSeek R1會讓你對當前最先進的AI祛魅,讓AI逐漸變成你生活中的水和電。太幸運了!太開心了!這樣震撼的突破,來自一個純粹的中國公司。知識與信息平權,至此又往前邁出了堅實的一步。”
DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技公司,專注于開發(fā)先進的大語言模型(LLM)和相關技術。
DeepSeek-R1 API價格。圖源:澎湃新聞
去年12月DeepSeek-V3發(fā)布后,AI數(shù)據(jù)服務公司Scale AI創(chuàng)始人Alexander Wang就發(fā)貼稱,DeepSeek-V3是中國科技界帶給美國的苦澀教訓。“當美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。”
不到一個月之后,今年1月20日,DeepSeek正式開源R1推理模型。
據(jù)DeepSeek介紹,其最新發(fā)布的模型DeepSeek-R1在后訓練階段大規(guī)模使用了強化學習技術,在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。
這一模型發(fā)布后,引發(fā)了海外AI圈眾多科技大佬的討論。例如,英偉達高級研究科學家Jim Fan就在個人社交平臺上公開發(fā)表推文表示:“我們正身處這樣一個歷史時刻:一家非美國公司正在延續(xù)OpenAI最初的使命——通過真正開放的前沿研究賦能全人類??此撇缓铣@恚钣腥さ慕Y局往往最可能成真。”
圖源:證券時報
1月24日,一條發(fā)布在匿名平臺teamblind上的帖子瘋傳。一名Meta員工稱,現(xiàn)在Meta內部因為DeepSeek的模型,已經(jīng)進入恐慌模式。
這位Meta員工寫道:
“一切源于DeepSeek-V3的出現(xiàn),它在基準測試中已經(jīng)讓Llama 4相形見絀。更讓人難堪的是,一家‘僅用550萬美元訓練預算的中國公司’就做到了這一點。
工程師們正在爭分奪秒地分析DeepSeek,試圖復制其中的一切可能技術。這絕非夸張。
管理層正為GenAI研發(fā)部門的巨額投入而發(fā)愁。當部門里一個高管的薪資就超過訓練整個DeepSeek V3的成本,而且這樣的高管還有數(shù)十位,他們該如何向高層交代?
DeepSeek-R1的出現(xiàn)讓情況更加嚴峻。具體細節(jié)屬于機密,不便透露,不過很快就會公開了。”
圖源:VCG
26日,DeepSeek出現(xiàn)了短時閃崩現(xiàn)象。不少網(wǎng)友反映,使用時遇到 “服務器繁忙” 的提示。對此,DeepSeek回應稱,當天下午確實出現(xiàn)了局部服務波動,但問題在數(shù)分鐘內就得到了解決。此次事件可能是由于新模型發(fā)布后,用戶訪問量激增,服務器一時無法滿足大量用戶的并發(fā)需求。不過,官方狀態(tài)頁并未將這一事件標記為事故。
來源:九派新聞綜合每日經(jīng)濟新聞、證券時報、澎湃新聞、界面新聞等
原標題:DeepSeek登頂蘋果中國區(qū)免費榜第一,“黑神話悟空”創(chuàng)始人馮驥:震撼的突破
責任編輯:林鴻偉新海南手機客戶端
用微信掃一掃南海網(wǎng)手機客戶端
用微信掃一掃南海網(wǎng)微信公眾號
用微信掃一掃南海網(wǎng)微博
用微博掃一掃