1. 大模型產(chǎn)品化若干思考

        共 2432字,需瀏覽 5分鐘

         ·

        2023-07-04 09:21

        前段時間,發(fā)表的《以AI產(chǎn)品經(jīng)理的視角,談?wù)剬hatgpt們的理解》,算是對chatgpt為代表的大模型初步認(rèn)知。過去幾個月,工業(yè)界和學(xué)術(shù)界又產(chǎn)生了非常多的實(shí)踐和洞察,帶動對于大模型邊界和商業(yè)落地有了更新的認(rèn)知與思考。 大模型能力認(rèn)知 這里講的大模型默認(rèn)是這次浪潮核心的自然語言大模型,能力認(rèn)知也不限于chatgpt這類對話機(jī)器人表現(xiàn)出的能力。 以gpt為代表的大模型具有非常多的能力,理解大模型如何獲取這些能力,是理解和從事大模型相關(guān)工作的基礎(chǔ)。一些學(xué)者做了許多實(shí)驗(yàn),大模型在給出一些答案時,是對答案「理解」并且能給出思考邏輯的。 因此即便大模型的結(jié)構(gòu)存在不可解釋的問題,仍然能夠相信大模型具備各種能力都是基于海量語言數(shù)據(jù)訓(xùn)練出了「世界」模型,達(dá)到了對世界的認(rèn)知與理解,并且訓(xùn)練世界模型前提是達(dá)到一定的模型參數(shù)量和模型大小,即達(dá)到涌現(xiàn)的臨界點(diǎn)。 訓(xùn)練大模型步驟通常是經(jīng)過預(yù)訓(xùn)練、微調(diào)和對齊等階段。通常來講,預(yù)訓(xùn)練階段大模型能力就已經(jīng)具備了,微調(diào)和對齊階段更多是將對模型能力激發(fā)、釋放和滿足人類倫理下使用。對齊階段受限于人類社會倫理問題,實(shí)際上是犧牲能力換安全合規(guī)的過程。 在預(yù)訓(xùn)練階段,很多垂直任務(wù)已經(jīng)被隱含的訓(xùn)練,因此大模型才具備很多垂直任務(wù)。一些業(yè)界評估發(fā)現(xiàn),大模型隱含的垂直任務(wù)并非都能比之前單獨(dú)訓(xùn)練垂直任務(wù)小模型效果要好,因此在很多垂直領(lǐng)域,小模型或者NLP算法人員仍然有用武之地。 大模型輸出仍然是個概率問題,因此會出錯,會出現(xiàn)「幻覺」,因此在高風(fēng)險決策場景仍然需要人機(jī)協(xié)同,從這點(diǎn)來看,大模型想把人工完全取代還談不上。 從AIGC到AIGA 這波大模型浪潮里,通過AI做內(nèi)容生產(chǎn)(AIGC)非常普遍,吃瓜群眾也樂此不疲。但問題在于通過大模型開一家淘寶店如果大模型只是提供文案和圖片素材,還是有大量的決策工作需要淘寶店主來決策,遠(yuǎn)遠(yuǎn)達(dá)不到成為「自動賺錢機(jī)器」的地步。因此從AI內(nèi)容生產(chǎn)(AIGC)到AI決策生產(chǎn)(AIGA)就是真正改變世界的關(guān)鍵。 前段時間出來的autoGPT 就是希望通過決策命令利用GPT自動完成決策任務(wù),而實(shí)際執(zhí)行下來可用性并不太高。GPT通過調(diào)用插件和編程能力可以具備一定的決策能力,但對于復(fù)雜決策仍然能力有限。并且通過思維鏈方式多步引導(dǎo)chatgpt比一步效果要好,這倒類比《思考,快與慢》中對于人類大腦系統(tǒng)一和系統(tǒng)二的區(qū)別。 市面上解決決策任務(wù)通常的技術(shù)路徑是用強(qiáng)化學(xué)習(xí)訓(xùn)練智能體,智能體具備執(zhí)行特定任務(wù)的最優(yōu)策略,智能體存在任務(wù)遷移差和不可解釋的問題。傳統(tǒng)的有監(jiān)督和無監(jiān)督機(jī)器學(xué)習(xí)前提假設(shè)所有樣本同概率同分布,不會改變數(shù)據(jù)的空間分布,而強(qiáng)化學(xué)習(xí)是通過權(quán)值構(gòu)造不同的數(shù)據(jù)空間分布,找出最優(yōu)策略。在垂直決策場景中,強(qiáng)化學(xué)習(xí)仍然是AIGA繞不開的技術(shù)手段。 大模型商業(yè)化 最近光年之外王慧文抑郁和光年之外被美團(tuán)收購,促成了大模型創(chuàng)業(yè)首波商業(yè)變現(xiàn)。但大模型創(chuàng)業(yè)商業(yè)化仍然能夠困難重重。三四個月之前,業(yè)界和大眾普遍對大模型研發(fā)懷有敬畏,而如今僅中國市場上已經(jīng)有70+公司發(fā)布了大模型,而且模型效果還不錯,并沒有想象地與美帝同行差距那么大,看起來技術(shù)壁壘不如之前業(yè)界認(rèn)為的大,同時大模型開源進(jìn)一步降低基礎(chǔ)大模型的壁壘,云廠商提供大模型開發(fā)底座更進(jìn)一步降低大模型研發(fā)門檻。起初百度李彥宏希望通過大模型,帶動搜索和云計算的產(chǎn)生絕塵效果顯然不夠理想,大模型的稀缺性被打碎。 傅盛和朱嘯虎大模型之爭,其實(shí)是大模型美好理想和現(xiàn)實(shí)落地的沖突。大模型具備各種能力,但考慮商業(yè)落地,仍然繞不開場景、增量價值和ROI的問題,這些問題之前一波AI浪潮也經(jīng)歷過,并且至今仍然一地雞毛。 大模型落地首先要尋找落地場景,直覺上大模型可以解決很多問題,而落地在商業(yè)場景上又需要解決可用問題,上述介紹大模型能力邊界決定著場景不能涉及高風(fēng)險決策的問題,而低風(fēng)險決策又會面臨低人力成本痛點(diǎn)不足的問題。 另外大模型很多落地場景,并非等著大模型去填充空白,而往往是垂直小模型已經(jīng)在服役的狀態(tài),大模型的增量價值是否能夠更好做任務(wù)也是繞不開的問題,如上所述,大模型并非在所有任務(wù)上都能優(yōu)于垂直模型。 當(dāng)然只要無限數(shù)據(jù)和無限算力,大模型總可以超過垂直模型效果,但商業(yè)社會另外的邊界就是ROI問題,客戶采購大模型或應(yīng)用,采購成本和后續(xù)資源成本能否遠(yuǎn)低于帶來的價值仍然是個挑戰(zhàn),花大價錢采購錦上添花的大模型或應(yīng)用顯然有違常理。 以上問題,目前所有大模型廠商和應(yīng)用廠商仍然在探索和回答,大概3-6個月相信會經(jīng)過一輪自然篩選,然后篩選下來的有價值場景,將進(jìn)入慘烈的同類價格競爭,經(jīng)過這兩輪篩選,仍然能夠存活的才邁出了商業(yè)化的第一步。有商務(wù)優(yōu)勢和行業(yè)基礎(chǔ)工具優(yōu)勢的選手具有更大概率能夠存活下來。 大模型進(jìn)一步落地發(fā)展仍然值得期待。


        關(guān)于作者:

        小樂帝,一線大數(shù)據(jù)&AI產(chǎn)品經(jīng)理、簡書互聯(lián)網(wǎng)優(yōu)秀作者、產(chǎn)品經(jīng)理讀書會創(chuàng)始人。

        「產(chǎn)品經(jīng)理讀書會」

        專注于愛讀書愛思考的產(chǎn)品人提供讀書推薦、產(chǎn)品思考、以書會友的環(huán)境

        歡迎愛讀書的產(chǎn)品人分享產(chǎn)品道路上的感悟

        歡迎關(guān)注公眾號:產(chǎn)品經(jīng)理讀書會






        長按二維碼關(guān)注我們


        改變世界




        瀏覽 78
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
          
          

            1. 天天爽天天干成人av一区二区三区 | 美国伦理《水蜜桃》 | 日本理伦手机在线观看免费 | 啊轻点灬太粗太长了三男一女 | 91色在线观看视频 |