4月18日,,APUS在“AiLMe·最懂你”發(fā)布會(huì)現(xiàn)場(chǎng)發(fā)布自研多模態(tài)人工智能大模型“AiLMe”,。AiLMe參數(shù)已達(dá)千億規(guī)模,具備對(duì)文本,、圖像,、視頻、音頻的理解和生成能力,。針對(duì)具體應(yīng)用場(chǎng)景,,APUS從AiLMe內(nèi)蒸餾出文本模型“異雀八”、圖像模型“異雀三”,、視頻模型“異雀四”,、音頻模型“異雀六”四個(gè)垂直領(lǐng)域精煉模型,并基于此創(chuàng)新研發(fā)出“智能問(wèn)答大師,、簡(jiǎn)筆成畫,、墨染、Daily Astro,、Star Night,、KJV Bible Now、PicPik”等系列AI產(chǎn)品,。
AiLMe問(wèn)世的 “前世今生”
人工智能大模型“利用深度學(xué)習(xí)模型生成文本,、圖像、音頻或視頻等內(nèi)容”,,讓處于“手工”時(shí)代的信息化產(chǎn)業(yè)一躍邁入“工業(yè)”時(shí)代,。在APUS創(chuàng)始人兼CEO李濤看來(lái),今天人們的生產(chǎn)生活是生長(zhǎng)于“信息化”平臺(tái)之上的,而在未來(lái),,AI將取代信息化成為萬(wàn)物生長(zhǎng)的土壤,。“人工智能是AI時(shí)代的操作系統(tǒng),將重塑信息產(chǎn)業(yè),、農(nóng)業(yè),、制造業(yè)、服務(wù)業(yè)等所有產(chǎn)業(yè),,起到大規(guī)模提質(zhì)提效的作用,。”
當(dāng)下,全球AI產(chǎn)業(yè)百舸爭(zhēng)流,,但能夠?qū)崿F(xiàn)超千億參數(shù)的大模型研發(fā)并非易事,。大模型尤其是多模態(tài)大模型的塑造是結(jié)合算力、算法,、數(shù)據(jù),、場(chǎng)景的綜合性系統(tǒng)工程,這決定了大模型的鍛造絕非一朝一夕之功,,而是要有對(duì)AI的前瞻布局和長(zhǎng)期積淀,。
人工智能產(chǎn)業(yè)賽道長(zhǎng)坡厚雪,與大模型有關(guān)的技術(shù)也已存在近十年的探索蓄力,,APUS是最早開始關(guān)注并投入人工智能的入局者之一,,“我們?cè)?018年就進(jìn)行了AI技術(shù)布局,并在2018年推出了多款基于AI技術(shù)的應(yīng)用如CutCut,、PickU ,、Vieka等,用戶可以體驗(yàn)智能摳圖,,變老變年輕等功能”,,李濤介紹。
李濤在發(fā)布會(huì)上闡述了APUS轉(zhuǎn)型人工智能的契機(jī),,在ChatGPT“出圈”前兩個(gè)月,,APUS就因?yàn)槿蚧?jīng)驗(yàn)感知到了人工智能揮動(dòng)的“蝶翼”,“今年一月我們就已經(jīng)在內(nèi)部所有系統(tǒng)接入人工智能,,用來(lái)提升工作效率,;隨后便進(jìn)行產(chǎn)品的改造升級(jí);大模型AiLMe也是我們階段性的重要成果”,。全球超24億用戶積累,、領(lǐng)先的產(chǎn)品和技術(shù)、多元化場(chǎng)景和海量數(shù)據(jù),,讓APUS入局人工智能“有能力,、有潛力”。此前,李濤在接受媒體專訪時(shí)表示,,人工智能發(fā)展將遵循“四步走”,,即現(xiàn)有信息系統(tǒng)提效,現(xiàn)有產(chǎn)品服務(wù)改造與重構(gòu),,新場(chǎng)景,、新物種,以及全產(chǎn)業(yè)升級(jí),, APUS自身的發(fā)展路徑也印證著這一觀點(diǎn),。
APUS大模型“AiLMe”的架構(gòu)與能力
3月,首次具備對(duì)圖像理解能力的GPT-4發(fā)布,,讓“多模態(tài)”大模型在行業(yè)普及并進(jìn)入大眾視野,。多模態(tài)的“多”有哪些能力?大模型的“大”又從何而來(lái),?AiLMe的架構(gòu)與能力又有哪些特別優(yōu)勢(shì),?發(fā)布會(huì)現(xiàn)場(chǎng)還發(fā)布了國(guó)內(nèi)首份多模態(tài)大模型技術(shù)白皮書《AiLMe技術(shù)白皮書》,。
所謂“多”就是指其在大語(yǔ)言模型的基礎(chǔ)上,,又融合了對(duì)圖像、視頻,、聲音的理解和生成,。而參數(shù)規(guī)模決定著大模型整體的理解和生成能力,大模型的“大”即是大規(guī)模參數(shù),,參數(shù)越大,,存儲(chǔ)的知識(shí)越多,模型能力越強(qiáng),。
AiLMe的技術(shù)架構(gòu)設(shè)計(jì):在文本,、圖像、視頻,、音頻的“理解”部分,,采用目前業(yè)內(nèi)主流的Transformer架構(gòu)。同時(shí),,AiLMe吸收了目前人工智能最前沿的研究成果,,設(shè)計(jì)了一套“插件式”架構(gòu),可以自主學(xué)習(xí)和使用“工具”,,這些“工具”以插件的方式接入到AiLMe的平臺(tái)中,,可以極大提升AiLMe的能力。在文本,、圖像,、視頻、音頻的“生成”部分,AiLMe則沿用了目前業(yè)內(nèi)主流的擴(kuò)散模型(Diffusion Model),,并繼承了開源社區(qū)的生態(tài),。
在AI大模型時(shí)代,數(shù)據(jù),、算法和算力正在經(jīng)歷新的演變,,大模型參數(shù)量以指數(shù)級(jí)速率提升,數(shù)據(jù)量也隨著多模態(tài)的引入進(jìn)行大規(guī)模增長(zhǎng),,導(dǎo)致算力需求劇增,。AiLMe在模型訓(xùn)練時(shí),分為預(yù)訓(xùn)練(Pre-trained)階段和微調(diào)(Fine-tuning)階段,。為解決算力問(wèn)題,,APUS在國(guó)內(nèi)鄭州和新加坡分別建設(shè)了兩大智算中心,還融合自建GPU服務(wù)器算力和第三方的算力協(xié)同作用,。在數(shù)據(jù)方面,,目前大模型的訓(xùn)練數(shù)據(jù)一般來(lái)自于互聯(lián)網(wǎng)公開的語(yǔ)料庫(kù)、網(wǎng)頁(yè)以及行業(yè)公開數(shù)據(jù),,但在APUS繪制的訓(xùn)練數(shù)據(jù)圖中可以看到,,其自有數(shù)據(jù)也占了很大比重——在為全球用戶提供產(chǎn)品和服務(wù)時(shí),APUS積淀的高質(zhì)量專有數(shù)據(jù)成為其研發(fā)全球性大模型的優(yōu)勢(shì)之一,。
AI技術(shù)發(fā)展日新月異,,在全球AI研究人員的共同努力下,行業(yè)對(duì)AI大模型的理解進(jìn)一步深入,,逐漸認(rèn)識(shí)到,,“決定大模型效果的因素按照重要性來(lái)排序:訓(xùn)練數(shù)據(jù)質(zhì)量>訓(xùn)練數(shù)據(jù)規(guī)模>參數(shù)規(guī)模。”因此今天AI技術(shù)研究的前沿,,已經(jīng)告別了單純?cè)黾哟竽P蛥?shù)規(guī)模的階段,,而要在提高訓(xùn)練數(shù)據(jù)質(zhì)量和加大訓(xùn)練數(shù)據(jù)規(guī)模上下功夫。AiLMe采用高質(zhì)量的海量訓(xùn)練數(shù)據(jù)來(lái)訓(xùn)練模型,,實(shí)現(xiàn)了較好的效果,。
今天的AiLMe已具備了自主學(xué)習(xí)能力。Chat GPT支持插件被認(rèn)為是AI自我進(jìn)化的雛形,,但過(guò)程中尚需要用戶手動(dòng)選擇插件,;而AiLMe在設(shè)計(jì)時(shí),緊跟AI技術(shù)發(fā)展前沿,,采用了插件式架構(gòu),,后續(xù)能夠通過(guò)迭代開發(fā)補(bǔ)充各種插件來(lái)擴(kuò)充自身能力,并且可以自主學(xué)習(xí)調(diào)用插件,,無(wú)需用戶干預(yù),,就能夠使大模型實(shí)現(xiàn)目標(biāo)驅(qū)動(dòng),,進(jìn)行自我進(jìn)化。
把“數(shù)據(jù)庫(kù)”變“智慧島”,,實(shí)現(xiàn)人機(jī)共智,,強(qiáng)大的多模態(tài)大模型AiLMe便是這背后的強(qiáng)大“引擎”。通過(guò)自主學(xué)習(xí)和人類反饋不斷解鎖新能力,,AiLMe還將更高效地解決個(gè)性化,、開放式的海量任務(wù)。目前,,AiLMe已在多個(gè)To C場(chǎng)景中落地,,在場(chǎng)景多樣性、任務(wù)復(fù)雜度上顯示出能力與潛力,。
據(jù)悉,,AiLMe將會(huì)向客戶開放API接口和服務(wù),屆時(shí),,客戶可根據(jù)實(shí)際應(yīng)用需求,,調(diào)用AiLMe的各項(xiàng)AI技術(shù)能力。
AiLMe能力釋放,,推出系列AI創(chuàng)新產(chǎn)品
聊天對(duì)話,、創(chuàng)作文章、作詩(shī)譜曲,、慰藉心緒……在AiLMe之上,,智能應(yīng)用煥發(fā)出了全新生機(jī),。
從AiLMe大模型蒸餾出的異雀(八,、三、四,、六)系列精細(xì)模型,,分別對(duì)應(yīng)著文、圖,、視,、音四個(gè)垂直領(lǐng)域,基于四款精煉模型,,APUS創(chuàng)新研發(fā)了多款人工智能產(chǎn)品,。
KJV Bible Now是一款面向海外市場(chǎng)的《圣經(jīng)》產(chǎn)品,讓用戶擁有自己的專屬牧師助手,,幫助其解答用戶困惑,,釋放情感。PicPik,,是一款A(yù)I圖片,、視頻,、娛樂(lè)創(chuàng)作工具,能夠幫助用戶高質(zhì)量,、高效率,、低門檻的創(chuàng)作。Daily Astro是一款面向海外市場(chǎng)的款塔羅牌產(chǎn)品,,讓星座,、占卜愛(ài)好者實(shí)現(xiàn)牌面占卜、運(yùn)勢(shì)解析,。Star Night是一款助眠類產(chǎn)品,,除了能為用戶提供白噪音音頻等幫助用戶快速入睡,還能依據(jù)用戶喜好勾勒出理想的數(shù)字睡眠伴侶,,讓它來(lái)朗讀睡眠故事,。智能問(wèn)答能夠在對(duì)話之間幫助用戶快速完成撰寫報(bào)告、論文,、程序,、簡(jiǎn)歷及解答生活疑問(wèn)等;簡(jiǎn)筆成畫則讓用戶變身“神筆馬良”,,只要在手機(jī)屏幕上畫出草圖,,寥寥幾筆,它就會(huì)自動(dòng)補(bǔ)全圖案,,形成精美繪畫,;墨染作為AI繪畫工具素材創(chuàng)作社區(qū),功能豐富,,除了有慕夏,、畢加索等30多款創(chuàng)作風(fēng)格可選,還具備文案優(yōu)化等功能,。
AiLMe的能力釋放讓AI產(chǎn)品更加智慧,、場(chǎng)景更加多元,既豐富了APUS的產(chǎn)品矩陣,,也為開發(fā)者打造了創(chuàng)新平臺(tái),。
目前,國(guó)內(nèi)AI行業(yè)的發(fā)展可謂百花齊放,、百舸爭(zhēng)流,,越來(lái)越多的企業(yè)和機(jī)構(gòu)開始投入大量資金和人力來(lái)研究和開發(fā)AI技術(shù),推動(dòng)了AI產(chǎn)業(yè)的快速發(fā)展和創(chuàng)新,。期待APUS的AiLMe大模型越來(lái)越強(qiáng)大,,為用戶提供更加全面、精準(zhǔn)的服務(wù)體驗(yàn),,同時(shí)隨著技術(shù)的不斷發(fā)展有更廣泛的應(yīng)用場(chǎng)景與更出色的表現(xiàn),。