东升国际官网

申請試用
登入
  • hd-share-img01
資訊與博客

商湯科技日日新SenseNova 4.0 發布,帶來全新的AI體驗

2024-02-02

商湯科技發布「日日新SenseNova 4.0」,全面升級大模型體系 。「日日新SenseNova 4.0」擁有更全面的知識覆蓋、更靠得住的推理能力,更優越的長文本理解力、及更穩定的數字推理能?,以及更強的代碼天生能力,同時跨模態交互 。日日新·协商大語言模型-通用版本(SenseChat V4),支持 128K 語境窗口長度,綜合整體評測成績水平媲美 GPT 4,更全面超逾 GPT 3.5 。(API申請網址:https://platform.sensenova.cn/)

商湯亦率先推出增援分歧模態工具調用的日日新·协商大語言模型 Function call & Assistants API 版本,為先進的大模型與各類應用服務工具的連接提供方便橋梁,顯著降低開發者使用大模型的門檻 。

商湯也將先進的大模型能力轉化為落地實際場景的產品應用,基於最新發布的日日新·协商大語言模型 Function call & Assistants API 实现開發並正式發佈數據分析工具「辦公幼浣熊」 。

目前,憑借豐富的 AI 技術能力,商湯「日日新 Sense Nova」大模型體系以低成本、高 效能买通了各類 AI 應用,提供蕴含面向辦公場景的商湯日日新·协商語言大模型-數據分 析版本、面向醫療場景的日日新·协商語言大模型-醫療版本「大醫」、 面向自動駕駛及 工業場景的日日新·协商多模態大模型,以及面向創作創意場景的日日新·秒畫文生圖大模型等豐富的工具 。

商湯「日日新·协商大語言模型」在金融、手機、醫療、汽車、地產、能源、傳媒、工業 製造等眾多垂直行業,已與超過 500 家客戶成立深度合作,加快行業企業的智能化轉型 。

接下來,商湯「日日新 SenseNova」大模型體系及相關產品和工具為實現通用人为智能 (AGI)提供了精准著力點,助力全場景、多產業實現「大模型+」,拓寬大模型應用邊界 。


「節前大上新」!超豐富大模型體系,AI能力隨取隨用

「日日新SenseNova 4.0」提供了多種靈活的API接口和服務,開發人員能够根據實際應用需要,輕鬆地調用日日新SenseNova大模型的各項AI技術能力,以更低成本、更高效能實現各類AI應用 。

大模型机能提升的基礎,在於語言建模能力的增強 。「日日新SenseNova4.0」全新升級协商大語言模型-通用版本(SenseChat V4),目前支持4k、32k、128k tokens分歧窗口,拓展了模型應用範圍 。SenseChat V4 顯著提升了在知識理解、閱讀理解、綜合推理、斅讽、代碼和長文本理解等領域的通用能力,綜合整體評測成績水平比肩GPT-4 ,其中推理和代碼編程的測評表現更是超过了GPT-4 。於權威測試集HumanEval Coding的測試中,一次通過率達到75.6%(GPT-4此項數據為74.4%) 。

Slide5.PNG

Slide3.PNG

基於大模型評測平台OpenCompass全集測試,日日新·协商大語言模型SenseChat V4,綜合整體評測成績水平比肩GPT-4                 

 

Screenshot 2024-02-02 at 21.14.01.png

商湯日日新·协商語言大模型-數據分析版本(SenseChat-DataAnalysis V4)正式發佈,在數據分析場景下的數據測試集(1000+題目)中85.71%的正確率超過GPT-4,支持複雜表格、多表格、多文件的理解,實現數據洗濯、數據運算、比較分析、趨勢分析,預測性分析、可視化等常見數據分析任務,賦能財務分析、商業分析、銷售預測、市場分析、宏觀分析等多個應用場景 。

商湯推出的日日新·协商語言大模型-醫療版本:「大醫」(SenseChat-Medical V4),在本次更新中實現了更強的多輪對話與高低文理解能力、以及更豐富的工具調用能力,有效實現專業醫學問答及複雜醫學任務推理,並支持更多模態醫學文件的智能解讀和交互問答 。「大醫」在兩項行業權威評測——2023年職業藥劑師考試大模型評測、中文醫療大語言模型開放評測平台MedBench中,實現綜合評分排名第二,机能逼近GPT-4,其中職業藥劑師考試大模型評測中的兩個細分方向机能已超过GPT-4 。

Slide4.PNG

2023年職業藥劑師考試大模型評測結果,「大醫」綜合評分排名第二,並在兩個細分方向上机能超过GPT-4

Picture1.png

覆蓋13個醫學場景的大醫Web端展示頁面

多模態是人为智能大模型沉要的技術演進方向,日日新·协商多模態大模型(SenseChat-Vision V4)正式推出,其擁有300億參數,圖文理解能力處於全球領先水平,在權威評測基準測試集MME Benchmark上綜合得分排名首位,綜合得分達2199.5(超過GPT-4V的1926.57),已在智能駕駛、智能車艙、電力行業等多個實際場景落地應用,助力千行百業的產業升級 。 

Slide1.PNG

多模態大模型權威綜合基準測試MME Benchmark能够從定位、名人識別、景點識別、OCR、數學計算等14個維度來系統綜合評測模型的能力 。

 Slide2.PNG

日日新·协商圖文多模態大模型可回覆交通場景中圖文內容理解等複雜任務

商湯自研的日日新-秒畫文生圖大模型(SenseMirage V4)較此前版本,參數量提升至百億量級,通過Mixture of text experts、Spatial-aware CFG等算法優化,語義理解能力與圖像質感細節表現顯著增強,可達成電影級海報天生水平 。同時結合Adversarial Distillation算法,秒畫SenseMirage-Turbo加快版也正式對表發布,相較於基礎版本,可達到10倍推理加快成效 。

 

Picture2.jpg

秒畫SenseMirage 4.0全新升級,電影級圖片一鍵天生

 

率先支持分歧模態工具調用的Function call & Assistants API 版本來了,大模型時代的專屬開發副手

大模型的能力前沿且豐富,為讓更多開發人員及相關行業更便捷、高效地用好大模型, 商湯推出日日新·协商大語言模型 Function call & Assistants API 版本 。

日日新·协商大語言模型 Function call & Assistants API 版本為開發人員提供一個靈活、高度可定造的工具調用框架,提供了聯網搜索,代碼解釋,圖文問答,文生圖等多種工具調用,支持商湯日日新大模型體系,賦能多行業場景 。 

與其他同類產品相比,日日新·协商大語言模型Function call & Assistants API 版本率先支持分歧模態的工具調用,能夠支持圖文結合的多模態交互和數據分析代碼執行結果的直觀呈現,從而解決越发複雜的問題,讓各種應用法式中集成AI职能變得越发簡單和高效 。

assistants api demo.gif

通過日日新协商大語言模型 Function call &Assistants API,輕鬆調用內置工具實現多模態交互(注:展示成效有加快處理)

創新場景應用加快落地,商湯「日日新」大模型體系持續賦能多產業升級

大模型的出現帶來了人機交互範式的巨大轉換,依託商湯「日日新Sensenova」能力的急剧迭代,幼浣熊家族再添新成員——數據分析工具 「辦公幼浣熊」,沉塑大模型時代的應用產品形態 。

辦公幼浣熊是一款無需編程或複雜操作即可使用的數據分析工具 。通過天然語言輸入,辦公幼浣熊結合商湯大模型體系的意圖識別、邏輯理解、代碼天生能力,自動將數據轉化為有意義的分析結果和可視化圖表 。得益於商湯大模型體系的強大中文理解能力,該產品更適應中國的數據分析需要 。

Picture5.png

辦公幼浣熊演示頁面:輸入表格,輕鬆獲取分析報告 。體驗入口:https://raccoon.sensetime.com/

產品形態的出現是大模型技術落地應用的嘗試之一,自去年4月10日商湯「日日新SenseNova」問世以來,企業用戶超過3000家,覆蓋行業蕴含互聯網、遊戲、文旅、教育、醫療健全、金融和編程等 。

商湯始終推動降低大模型使用門檻,拓展人为智能落地場景,讓大模型真在行業里用起來,未來將持續推進「日日新SenseNova」大模型體系建設,實現創新場景應用,不斷推動大模型前置化,讓更多智能走向更多場景、更多行業,攜手行業生態邁向AGI時代 。


go_top
【网站地图】