資料是個寶
資料寶
投資少煩惱
2月1日,#DeepSeek在美商標被梁文鋒校友搶注#的話題衝上微博熱搜。據新華每日電訊援引TC報道,一家總部位於美國特拉華州的名稱為Delson Group的公司申請了DeepSeek商標。報道稱,Delson Group的執行長兼創始人名為Willie Lu,後者與DeepSeek創始人梁文鋒畢業於同一所大學——浙江大學。
另外,據雲官方公眾號2月1日訊息,DeepSeek-R1開源後引發全球使用者和開發者關注。經過矽基流動和華為雲團隊連日攻堅,現在,雙方聯合首發並上線基於華為雲昇騰雲服務的DeepSeekR1/V3推理服務。
值得關注的是,最近幾天,DeepSeek的熱度居高不下。日前,、微軟、亞馬遜等AI巨頭紛紛宣佈,已接入DeepSeek。此外,或許是迫於DeepSeek帶來的壓力,OpenAI緊急上線新一代推理模型o3-mini,並首次向ChatGPT免費使用者開放推理模型。
國泰君安指出,DeepSeek-R1以MIT License完全開源模型權重,並允許商用模型蒸餾,為開發者提供了二次創新的自由空間。這一策略推動中國首次在通用大模型開源領域佔據技術制高點,增強全球AI 話語權。同時,開源生態可能加速行業技術路線趨同,通用大模型因同質化加劇競爭,只有擁有真正領先技術的企業才能在這種趨勢中留存。因此,此次國產開源模型的突破有望重塑全球AIGC技術路線及產業格局。
在美商標被梁文鋒校友搶注
據新華每日電訊援引TC報道稱,近日,中國人工智慧公司 DeepSeek成為大規模網路攻擊的目標。現在,該公司似乎又面臨新的麻煩:美國商標糾紛。另一家公司申請了DeepSeek商標:一家總部位於特拉華州的公司,名稱為Delson Group Inc.
Delson Group 聲稱,它自2020年初以來一直在銷售DeepSeek品牌的 AI 產品。其執行長兼創始人名為 Willie Lu。Willie Lu與 DeepSeek 創始人梁文鋒畢業於同一所大學——浙江大學。
DeepSeek,全稱杭州深度求索人工智慧基礎技術研究有限公司,成立於2023年7月17日,是一家創新型科技公司,專注於開發先進的大語言模型(LLM)和相關技術。
DeepSeek在2024年12月26日推出V3(對標GPT4o),因其顯著的效能,使用者迅速開始增長,同時在1月20日釋出R1(對標GPT-o1)後,進一步出圈。根據點點資料,從DeepSeek在美國下載排名從1月22日的201名,迅速在1月27日登頂第一名;根據七麥資料,截至1月30日,DeepSeek在168個國家位居下載榜第一名。
1月24日,著名投資公司A16z的創始人馬克·安德森發文稱,Deepseek-R1是他見過的最令人驚歎、最令人印象深刻的突破之一,而且還是開源的,它是給世界的一份禮物。最具煽動性的評價來自ScaleAI創始人亞歷山大·王(AlexandrWang)。他說:過去十年來,美國可能一直在AI競賽中領先於中國,但DeepSeek的AI大模型釋出可能會“改變一切”。
AI巨頭紛紛接入DeepSeek
1月31日,英偉達(NVIDIA)宣佈,NVIDIA NIM已經可以使用DeepSeek-R1。英偉達官網當天釋出文章指出,DeepSeek-R1是具備最先進推理能力的開放模型,比起直接提供響應,像DeepSeek-R1這樣的推理模型,會對查詢進行多次推理處理,使用連鎖思維、共識和搜尋方法來生成最佳答案。
上述文章寫道,為了幫助開發者安全地試驗這些功能,並構建自己的專門代理,DeepSeek-R1模型現已作為NVIDIA NIM微服務預覽版上線使用。
報道稱,DeepSeek先前橫空出世重創美國科技股,一度影響英偉達股價重挫17%,引發討論。英偉達先前也發聲,指DeepSeek的進步,代表了英偉達晶片對於內地市場的可用性,而未來,DeepSeek會需要更多英偉達晶片滿足服務的需求。
另據參考訊息援引臺灣東森新聞網報道,近日,與OpenAI是密切合作伙伴的宣佈,目前已將DeepSeek-R1正式納入Azure AI Foundry,成為該企業級AI服務平臺的一部分。
微軟作為OpenAI的最大股東,長期資助OpenAI之餘,還深度整合其AI技術,因此將DeepSeek-R1正式納入的訊息曝光後,外界十分關注微軟為何在OpenAI對DeepSeek進行調查的同時,仍決定將R1模型納入其AI服務。
微軟強調,DeepSeek-R1模型已透過“嚴格的紅隊測試與安全評估”,並經歷“模型行為自動化檢測與廣泛的安全審查,以降低潛在風險”。
微軟也在宣告中提到,後續微軟仍會持續評估DeepSeek-R1模型,並可能進行一定程度的調整與最佳化,以提升其準確度及審查機制。
1月31日,雲科技也宣佈,客戶現已可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。此外,客戶還可以透過Amazon EC2、Amazon SageMaker AI,使用Amazon Trainium和Amazon Inferentia部署DeepSeek-R1-Distill。
OpenAI首次向免費使用者開放推理模型
DeepSeek的爆火,使得全球在AI領域的競爭進一步白熱化。當地時間1月31日,OpenAI正式上線競品推理模型o3-mini,並首次向免費使用者開放推理模型。
OpenAI介紹稱,o3-mini支援開發者調整“AI推理努力程度”分為低、中、高三個級別。這種靈活性使得o3-mini可以在面對難題時“更努力思考”,而需要效率時優先考慮回應速度。
據OpenAI披露,在2024年美國數學邀請賽(AIME 2024)的測試中,低推理努力的o3-mini準確率(60%)與o1-mini差不多,但速率更快;而在中等努力下,o3-mini準確率能夠提升到79.6%,與o1模型相當。在最高努力水平時,o3-mini的準確率則能進一步提升至87.3%。在博士級科學問題(GPQA Diamond)方面,三種努力程度模型的準確率分別為70.6%、76.8%和79.7%。開發者可根據場景需求,靈活選擇低、中、高三級推理強度,使模型在應對複雜挑戰時能“深度思考”,或在需要快速響應時優先保證速度。
ChatGPT Plus、Team及Pro使用者即日(1月31日)可體驗o3-mini,企業使用者將在一週後獲得訪問許可權。即日(1月31日)起,免費版使用者也可透過訊息編輯器選擇“推理”模式或重新生成回覆來試用o3-mini,這是ChatGPT首次向免費使用者開放推理模型。
在OpenAI釋出新模型o3-mini後,麻省理工知名AI研究科學家、著名科技播客主持人評價該模型稱,OpenAI的o3-mini是個不錯的模型,DeepSeek的R1效能和它差不多,但價格更便宜,且能展示推理過程。更好的模型會不斷出現(很期待o3 Pro 面世),但 “DeepSeek 時刻” 意義非凡。5年後人們仍會銘記這一偉大時刻,是科技史上的關鍵節點,部分原因是其地緣政治影響,當然還有諸多其他緣由。
機構:DeepSeek重構大模型生態
DeepSeek日前釋出其最新開源模型DeepSeek-R1,用較低的成本達到了接近於OpenAI開發的GPT-o1的效能。這一進展破解了全球人工智慧產業長期以來“堆算力”的路徑依賴,其影響還波及了資本市場。
從定價看,DeepSeek-R1不僅開源,API(介面)價格還明顯低於GPT-o1。DeepSeek-R1輸入(快取命中)、輸出定價分別為每百萬tokens 1元、6元,低於GPT-o1的55元、438元,具備價效比優勢。
國際投行摩根士丹利表示,“更大(的模型)不再等於更聰明”,DeepSeek透過顯著提高資料質量和改進模型架構,展示了一條與之前大模型不同的高效訓練途徑。摩根士丹利說,DeepSeek的模型現在低成本優勢突出,與國際知名大模型相比,其成本大約低了一個數量級。
國泰君安指出,DeepSeek-R1以開源、高效能及低成本API對標OpenAI o1。其蒸餾模型的優異表現將支援消費電子、智慧駕駛等終端AI的部署,開源策略將重整通用模型競爭格局,大模型的商業化落地將在DeepSeek 的低價API支援下加速,未來垂類應用也有望加速創新迭代。該券商表示,R1在後訓練階段透過大規模強化學習技術,在極少標註資料下提升推理能力,驗證了演算法最佳化的高效性。這一技術突破打破了海外企業在複雜任務上的技術壟斷,為中國大模型技術參與全球競爭提供了實證支撐。
長江證券也表示,國產模型推理能力對齊業界領先水平,看好推理算力與應用側受益。一方面,國產推理模型持續迭代,推理側的scaling up將帶來推理算力需求的顯著提升;另一方面,透過利用DeepSeek-R1整理的80萬個樣本進行微調,小型模型推理能力顯著提升,或加速垂類模型應用落地程序。
來源:券商中國
宣告:資料寶所有資訊內容不構成投資建議,股市有風險,投資需謹慎。
責編:謝伊嵐
校對:姚遠
資料寶