■原題:算法訓練幾乎0成本!梧桐大模型讓首批用戶吃上“螃蟹”
■記者:思文
行業(ye)(ye)大(da)(da)模型正在爆炸式集中推出,關(guan)注大(da)(da)模型的(de)(de)人士都知道(dao)了行業(ye)(ye)大(da)(da)模型的(de)(de)簡單公式,通用大(da)(da)模型+行業(ye)(ye)場景+訓練調(diao)優(you)=行業(ye)(ye)大(da)(da)模型,因此訓練調(diao)優(you)是企(qi)業(ye)(ye)自研大(da)(da)模型不可避開的(de)(de)重要環節。
然在其他企業還在觀望,推(tui)出(chu),演(yan)示或者調優(you)的當下,宇視(shi)作(zuo)為推(tui)出(chu)AIoT行業大模型的第一人,6月(yue)9號(hao),其小范圍(wei)召開了大模型“梧桐”種子合作(zuo)伙伴簽約會(hui)并(bing)公開了“梧桐”未來的規劃(hua)。
目前“梧桐”針對需求計劃細化出三種不同模型:
l CV(計算機視覺)行業大模型
提供AI訓練、AI在(zai)線學習等服(fu)務,預計將(jiang)在(zai)7月底上線,現階段已(yi)經在(zai)小范圍測試。
l NLP(自然語言處理)行業大模型
提(ti)供資料中心、大(da)數(shu)據平(ping)臺、代(dai)碼開發等服務,這是一款(kuan)自用行業大(da)模型,目(mu)前階段只(zhi)在宇視內(nei)部使用,主要(yao)用在內(nei)部生(sheng)產,精準度要(yao)求更(geng)高(gao)。
l MM(多模態)行業大模型
提供Vlog等服務,目前已在樂(le)園景區(qu)、鄉(xiang)村振興(xing)等場景的視頻宣傳上有豐(feng)富的落地案(an)例。
那打出“AIGC平權”旗幟的宇視將怎么把技術平權和知識平權真正融進中小型企業業務里?
CPS中安網(wang)作為(wei)特邀媒(mei)體就此疑問(wen)與部分宇視核心(xin)高管面對(dui)面進行了“圓桌(zhuo)對(dui)話”。
1、大模型趨勢下
中小型企業怎么用好數據?
中(zhong)小(xiao)企業(ye)作為中(zhong)國經濟發展的(de)重要主(zhu)體(ti)之一,據(ju)工信部公布的(de)數據(ju),2022年我(wo)國日均(jun)新設(she)企業(ye)達2.38萬戶,中(zhong)小(xiao)微企業(ye)數量已超過5200萬戶,在如今(jin)大模型熱潮下(xia),不少中(zhong)小(xiao)企業(ye)都在關注行(xing)業(ye)大模型將會如何為自身企業(ye)真(zhen)正(zheng)做到降本增效。
雖然數字化轉型理念愈來愈普及,不少中小企業都想搭上“高效”這趟車,但“數據怎么用?”“花費多少成本?”這兩大(da)疑慮把大(da)部(bu)分中小企業攔在了(le)車(che)門外。
除(chu)此之外(wai),雖說行業都在認可“ALL in AI”這一現狀,但不少中小(xiao)型(xing)企業對于AI的理解可能仍(reng)局限性停留(liu)在人臉(lian)識(shi)別(bie)。
宇(yu)視云智能產品部(bu)部(bu)長湯利(li)波告(gao)訴CPS中安(an)網,作為(wei)直接接觸(chu)到市場(chang)動向脈搏的(de)(de)中小型企業,其完全可以利(li)用數據針(zhen)對(dui)性訓練一些細(xi)分業務場(chang)景(jing)的(de)(de)算(suan)法(fa)(fa)。“通過(guo)場(chang)景(jing)化算(suan)法(fa)(fa)指標能力的(de)(de)提(ti)升,有機會去提(ti)升解(jie)決方案的(de)(de)增值性,包括服務收益的(de)(de)增值性。”
舉(ju)個簡(jian)單的(de)(de)(de)(de)例子(zi),在(zai)游樂園娛(yu)樂等場(chang)所,大(da)部(bu)分(fen)人可(ke)能(neng)(neng)認為攝(she)(she)像頭只是起到安(an)全防控的(de)(de)(de)(de)作用(yong),但假(jia)設負責這(zhe)(zhe)個場(chang)景業(ye)務(wu)的(de)(de)(de)(de)企業(ye),愿(yuan)意讓攝(she)(she)像頭搭載上提(ti)前訓練(lian)好(hao)的(de)(de)(de)(de)大(da)模型,訓練(lian)好(hao)的(de)(de)(de)(de)大(da)模型經(jing)過推(tui)理(li)后,將(jiang)其視頻數據進(jin)行自動分(fen)割、自動識別、剪輯(ji)美化(hua),游樂園就能(neng)(neng)從原有的(de)(de)(de)(de)出售游客圖片(pian)的(de)(de)(de)(de)業(ye)務(wu)升級到游客專屬vlog,這(zhe)(zhe)便讓原本只是躺在(zai)存儲里的(de)(de)(de)(de)數據得到了(le)進(jin)一步調(diao)動應用(yong)。
可(ke)以(yi)明顯看到,在大模(mo)型(xing)趨勢下,對于中小型(xing)企業(ye)而言,其如何通過大模(mo)型(xing)利用(yong)數據(ju)達到降本(ben)增效的作用(yong),結果還是開源或(huo)者節流,省下人(ren)力、時間(jian)、精力成本(ben)的同時對現有業(ye)務(wu)進行(xing)升級賦能,將服務(wu)收(shou)益最大化或(huo)許才是正解(jie)。
基(ji)于此,對于判(pan)斷市場上任意一項(xiang)新技術(shu)或者新產品是否值得應用,中小型企業往往更(geng)加在意實際投入成本幾何(he)。關于成本問題(ti),會(hui)上,宇視的大(da)模(mo)型也(ye)給(gei)出了階段(duan)性答案。
2、幾乎0成本訓練
梧桐CV行業大模型將上線
“我(wo)們需要更(geng)多的渠道(dao)能夠有這種(zhong)能力,更(geng)好的和(he)宇視(shi)合(he)作,而不是只(zhi)有幾家壟斷的市場。”宇視(shi)CPO朱兵說(shuo)。
具體來說,宇視(shi)的(de)賦能之道是,在(zai)訓(xun)(xun)練(lian)側上,用戶企業可以遠(yuan)程(cheng)通過(guo)互聯網訪問之后(hou)來訓(xun)(xun)練(lian)算法,宇視(shi)會承擔云的(de)租用費用,為用戶企業省去前期訓(xun)(xun)練(lian)需要的(de)成(cheng)本,企業可以幾乎0成(cheng)本獲得宇視(shi)開通的(de)大模型訓(xun)(xun)練(lian)賬號,在(zai)訓(xun)(xun)練(lian)過(guo)程(cheng)中,會有宇視(shi)專門(men)的(de)技術(shu)團隊進行(xing)支持。
在推理側上(shang),宇視通過將場(chang)景化的(de)算法進行剝(bo)離,也就是將相對小模型的(de)算法部署(shu)到宇視邊緣端的(de)設備上(shang),一定程度上(shang)避免合作(zuo)伙伴為(wei)此(ci)額(e)外部署(shu)一個幾千(qian)萬起(qi)步的(de)超算機房(fang)。
此外,算法拓展(zhan)在(zai)目前階段(duan)仍(reng)屬于(yu)煙(yan)囪(cong)式(shi),即使用戶需(xu)(xu)求很相近,但(dan)由(you)于(yu)對象的(de)不同還是需(xu)(xu)要重新生(sheng)成算法,容易導致投(tou)入產出(chu)比和客戶需(xu)(xu)求之間的(de)矛(mao)盾(dun),而(er)預計7月底正式(shi)上線的(de)“梧桐CV行業大模型”可以較(jiao)好解決這個問(wen)題。
舉個(ge)(ge)例子,假設(she)現在(zai)有60多萬(wan)(wan)個(ge)(ge)體(ti)育館,300多萬(wan)(wan)套器(qi)材,這60多萬(wan)(wan)個(ge)(ge)體(ti)育館的(de)(de)(de)器(qi)材放置(zhi)地點都不同(tong),此時(shi)項目方需要知道所有館的(de)(de)(de)器(qi)材的(de)(de)(de)使用(yong)頻率和大眾愿意使用(yong)哪(na)類(lei)健身器(qi)材,這時(shi)候如果用(yong)小模型就需要采集各個(ge)(ge)體(ti)育館的(de)(de)(de)數(shu)據進行對比再針對性地多次(ci)訓練,而“梧桐CV行業大模型”卻能(neng)在(zai)比較小的(de)(de)(de)數(shu)據量情況下(xia),做到泛化識別和推理(li),即使器(qi)材對象(xiang)千差萬(wan)(wan)別,但省去了二次(ci)訓練、學習的(de)(de)(de)環節。
場(chang)景多N倍,算(suan)(suan)法(fa)獲得率提升80%,算(suan)(suan)法(fa)精準度(du)從(cong)85%提升至(zhi)95%,讓IT工程訓練師訓練算(suan)(suan)法(fa),更容易解(jie)決(jue)行業Know-How問題,入門門檻更低(di),大模(mo)型梧桐的優勢也由此凸顯,
目前“梧桐CV行業大模型”已經和第一批合作伙伴完成落地計劃的簽約,率先在體育、教育、交通、零售等領域進行首發落地。
相(xiang)信在(zai)未(wei)來,大(da)(da)模型的(de)“訓練”“推理”兩個(ge)關鍵詞優勢將會日益凸顯,據了解,為(wei)保(bao)障大(da)(da)模型的(de)順利運行,宇(yu)視目(mu)前部署(shu)在(zai)云(yun)邊端芯片款型超(chao)過(guo)(guo)50款,支持的(de)算法種類超(chao)過(guo)(guo)1000個(ge),模型數過(guo)(guo)萬,產品款型過(guo)(guo)千。
前期成本宇視承擔,合作伙伴幾乎0成本接入,這么大的支持力度,相信業內人士都會十分好奇,宇視到底靠梧桐大模型怎么實現盈利?
3、瞄準生態價值
力爭高效落地
傳統意義上(shang),做了一個軟(ruan)件,投入(ru)100萬,就要力爭賣到200萬,最后賺100萬,光明正(zheng)大(da)的(de)追求利潤(run)是企業繞不開的(de)話題。
但這次,宇視并沒有打算使用傳統(tong)的(de)賣軟件直接獲利策(ce)略(lve),而是通(tong)(tong)過讓(rang)利給合(he)作(zuo)伙伴(ban),讓(rang)合(he)作(zuo)伙伴(ban)通(tong)(tong)過使用“梧桐”得到多個專屬的(de)“行業軟件工程師”。“讓(rang)宇視的(de)渠道盈利,讓(rang)他(ta)們有進入一些(xie)新的(de)業務模式的(de)可能。”朱兵說道。
在這個平權時代,支撐宇視此次這么大膽的行徑的信心和念想究竟來自哪里?
“平權時代,最大的(de)競爭力(li)在于你(ni)的(de)效率,在于公司看清楚(chu)自己(ji)的(de)定(ding)位之后能夠(gou)第(di)一(yi)時間全力(li)撲上去做。”
2012年,宇(yu)視(shi)捕捉到人(ren)工智能的(de)發展趨勢(shi),同(tong)年便開始在深度學習領(ling)域進行投(tou)入,2016年,宇(yu)視(shi)推(tui)出初代基于DL的(de)AIoT產品,如今來到大模型(xing)爆(bao)炸階段(duan),宇(yu)視(shi)又成為第一(yi)個推(tui)出“AIoT行業大模型(xing)”的(de)第一(yi)人(ren)。
2023年,宇視這次對于“梧桐”大模型的定位到底是什么?
沒錯,就是落地化,工程化。正如微軟將GPT-4對接Office、金山將其(qi)大(da)模型產品“WPS AI”接入(ru)WPS,大(da)模型最(zui)終的落地(di)還得是(shi)在硬件上。
那宇視怎么快速落地(di)實現工程化?總結為以下(xia)幾點:
1、原有的深度學習積累和產品工程化落地可繼承
2、站在通用大模型的肩膀上開發自己的行業大模型
3、通過“剪枝”和“蒸餾”等技術,實現行業大模型的邊緣側部署
4、開放能力給(gei)合(he)作伙伴,同時有專(zhuan)門的培訓和技術(shu)服務體系保障
也許正如此次宇(yu)(yu)(yu)視(shi)簽(qian)約(yue)種子伙伴之一的萬店掌所言,眾(zhong)多行業大模型中為什么(me)選(xuan)(xuan)擇宇(yu)(yu)(yu)視(shi),其實占比很大一部(bu)分(fen)原因是其本身已(yi)經(jing)和(he)宇(yu)(yu)(yu)視(shi)有過合(he)作,對宇(yu)(yu)(yu)視(shi)這個品牌(pai)已(yi)經(jing)存在(zai)一定(ding)的認知力和(he)認可(ke)度(du),剛好宇(yu)(yu)(yu)視(shi)在(zai)這個階段推出(chu)了大模型就相(xiang)當于為合(he)作伙伴提供了一條龍服(fu)務,省(sheng)去了對其他(ta)新品牌(pai)的學習、切換成本,選(xuan)(xuan)擇宇(yu)(yu)(yu)視(shi)會適配度(du)更高。
當(dang)然,在(zai)這個(ge)數(shu)據量爆炸的(de)(de)(de)(de)時代下,不(bu)少企業(ye)還(huan)是(shi)會(hui)(hui)十分在(zai)意保密性,而目前由于大(da)部(bu)分中小企業(ye)不(bu)具備私有(you)云(yun)的(de)(de)(de)(de)部(bu)署(shu)能力,因(yin)此(ci)愿意上云(yun)的(de)(de)(de)(de)企業(ye)的(de)(de)(de)(de)數(shu)據會(hui)(hui)相(xiang)對集中在(zai)公有(you)云(yun)上,一旦拿出來訓練是(shi)否(fou)會(hui)(hui)產生(sheng)泄漏的(de)(de)(de)(de)風險?
“我們前期在接(jie)觸合作伙伴過(guo)程中,也(ye)有(you)客戶有(you)安(an)全(quan)性(xing)的疑慮,主要疑慮在原有(you)數據(ju)是否外泄(xie)和(he)訓(xun)練成(cheng)果收否會被無償占用(yong)兩方面”湯利波說道。而宇視“梧桐”也(ye)將(jiang)通過(guo)相(xiang)關(guan)技術進行分權(quan)、分域,建立完(wan)善的權(quan)限管(guan)理和(he)安(an)全(quan)管(guan)控(kong)制度(du),融合等(deng)方式保證訓(xun)練成(cheng)果的安(an)全(quan)性(xing)和(he)獨享性(xing)。
4、大模型戰場已開局
是開始還是結束?
風起于青萍(ping)之(zhi)末,浪成于微瀾之(zhi)間。
相對之前(qian)企業(ye)(ye)拼(pin)數(shu)據(ju)樣本,拼(pin)私(si)有的(de)(de)訓練(lian)平臺,拼(pin)技術架(jia)構的(de)(de)小(xiao)模(mo)(mo)型(xing)(xing)AI時代,如(ru)今隨著大(da)模(mo)(mo)型(xing)(xing)相繼開源(yuan)后,有基(ji)礎(chu)的(de)(de)企業(ye)(ye)大(da)都(dou)可以基(ji)于(yu)開源(yuan)組件進行(xing)自(zi)身大(da)模(mo)(mo)型(xing)(xing)的(de)(de)自(zi)研(yan),先(xian)用通用大(da)模(mo)(mo)型(xing)(xing)把原(yuan)始(shi)的(de)(de)大(da)量行(xing)業(ye)(ye)場景的(de)(de)知識數(shu)據(ju)清洗一遍(bian),再(zai)把顯(xian)著目標值給提取出(chu)來,去重后形成行(xing)業(ye)(ye)數(shu)據(ju)庫(ku),最終投喂給通用大(da)模(mo)(mo)型(xing)(xing)訓練(lian)出(chu)一個行(xing)業(ye)(ye)大(da)模(mo)(mo)型(xing)(xing)。
Open AI用了上萬塊英偉達GPU喂出了一個ChatGPT,浪(lang)潮(chao)掀到中國,國內千模大戰(zhan)已(yi)拉開,行(xing)業大模型或將是未來各個領域都會去追尋的(de)模式。
縱觀安防行業幾十年的(de)(de)(de)(de)(de)發展,從模擬階(jie)段(duan)的(de)(de)(de)(de)(de)爭奪攝(she)像頭代理(li)權,到(dao)網絡數字階(jie)段(duan)的(de)(de)(de)(de)(de)系統業務(wu)成焦(jiao)點,再到(dao)智能化階(jie)段(duan)的(de)(de)(de)(de)(de)ALL in AI,如(ru)(ru)今已到(dao)大模型(xing)卷入(ru)階(jie)段(duan),或許正如(ru)(ru)宇視CEO張(zhang)鵬國曾在深圳安博會(hui)舉辦期間抒發的(de)(de)(de)(de)(de)經典語錄所言:“意識(shi)到(dao)這是場戰爭的(de)(de)(de)(de)(de)時候(hou),戰爭已經結束(shu)了,機會(hui)不會(hui)等待后知(zhi)后覺的(de)(de)(de)(de)(de)傲(ao)慢。”
[出處] 思文, 算法訓練幾乎0成本!梧桐大模型讓首(shou)批用戶(hu)吃上“螃蟹”.CPS中安網, 2024-06-14