GitHub 2K+星、B站播放量超30萬,大模型入門看這本書就夠了!
正文開始前,先派送福利
掃碼備注【送書】進群,參與 免費寄送 【 ChatGPT原理與應用開發(fā) 】 紙質(zhì) 圖書抽獎活動 ,活動截止日期 2024-03-17 晚上10點 。
也可自行購買,戳如下,專屬 5折 優(yōu)惠!京東專屬鏈接:
喜歡AI,對ChatGPT超級好奇,但被市面上爆增的大模型書籍和教學視頻弄得眼花繚亂?沒事!Datawhale團隊最新推出的“蝴蝶書”——《ChatGPT原理與應用開發(fā)》來啦! 這本書源自Datawhale開源項目HuggingLLM,GitHub 2K+星、B站播放量超30萬,是Datawhale在打造了“南瓜書”“蘑菇書”“熊貓書”后,推出的第4本王牌之作。 翻開《ChatGPT原理與應用開發(fā)》你會發(fā)現(xiàn),書中的內(nèi)容以實戰(zhàn)為主,不僅對相關任務有詳細的背景和系統(tǒng)設計介紹,還教你使用ChatGPT相關API創(chuàng)造新的功能和應用,并且提供實例代碼和實現(xiàn)流程,讓每一位學習者都能做出自己的AI產(chǎn)品!
為什么創(chuàng)作這本書?
借助ChatGPT,人們可以做到現(xiàn)在大部分 NLP 工程師在做的事,比如文本分類、實體抽取、文本推理等。甚至隨著大語言模型能力的不斷提升,它們可能做得比 NLP 工程師都要好。不過,AI也有許多局限性,要想實現(xiàn)應用就需要投入大量的資源和時間。其中涉及的理論多到爆炸不說,案例、代碼、實操、創(chuàng)新更是一個都不能少,搞不懂,易出錯,很多開發(fā)者一碰就想放棄。 開源項目 HuggingLLM力圖幫助人們降低門檻,縮小應用程序和研究之間的差距,使得大模型應用開發(fā)變得觸手可及。HuggingLLM是一個面向非算法專家但具有一定編程基礎,對人工智能和 ChatGPT(或類似模型)感興趣的人群的開源項目,旨在利用 ChatGPT API 開發(fā)相關應用。 所以,當開源項目HuggingLLM發(fā)布時,立即獲得了來自不同領域的朋友們的關注與支持,目前star點贊2K+。 翻閱參與者在Github上提交的成功案例,我們看到:有人機協(xié)同,創(chuàng)造未來的虛擬女友;
有應用非凡,前景無限的AI輔助自動標注;
有啟迪人生,提高問商的助思者;
有模擬人生,腦洞不停的AI NPC;
......
正如項目名字所寓意的那樣,上萬名參與者通過這個開源項目擁抱了AI時代的變化,無障礙地使用LLM創(chuàng)造了新的價值。 這個開源項目的組織者還在B站上同步更新視頻教程,播放量高達31.1W,獲得網(wǎng)友一片好評。紙書做了哪些更新?
《ChatGPT原理與應用開發(fā)》是基于大語言模型進行商業(yè)應用開發(fā)的最佳實踐書,更是值得你“好好上課”!
掃碼5折購書,限100人
初心不改
本書內(nèi)容也正如HuggingLLM最初的立項理由所述,主要是講基于 ChatGPT 的算法應用和服務,聚焦于自然語言處理的常見任務和應用。它向我們介紹了如何使用類似 ChatGPT 這樣的大語言模型來完成之前只有算法工程師才能處理的工作。內(nèi)容優(yōu)化
本書以實踐為主,重點是任務的講解和設計 ,但也會科普一些自然語言處理算法的基本原理和基礎知識,適合所有對大語言模型感興趣的開發(fā)者閱讀。本書一共有 8 章內(nèi)容,分別如下。 第 1 章基礎知識—大語言模型背后,主要介紹了與 ChatGPT 相關的 NLP 領域的基礎知識和原理。 第 2 章相似匹配—萬物皆可 Embedding,主要介紹了文本表示,以及與文本匹配相關的任務和應用。 第 3 章句詞分類—句子 Token 都是類別,主要介紹了 NLP 領域最常見的任務——分類。 第 4 章文本生成—超越理解更智能,主要介紹了與文本生成技術相關的任務。 第 5 章復雜推理—更加像人一樣思考,主要介紹了如何使用大語言模型做復雜的邏輯推理任務。 第 6 章工程實踐—真實場景大不同,主要介紹了如何在真實業(yè)務中使用大語言模型。 第 7 章局限與不足—工具不是萬能的,主要介紹了 ChatGPT(或其他類似的大語言模型)的缺陷或不擅長的地方,包括事實性錯誤、實時更新、性能瓶頸等方面。 第 8 章商業(yè)應用—LLM 是星辰大海,可以把該章當作一篇調(diào)研報告來閱讀,主要針對工具應用和行業(yè)應用兩大方面展開,期望能夠給讀者更多啟迪,幫助大家構(gòu)思更好的應用或服務。 這本書由郝少春、黃玉琳、易華揮三位作者在HuggingLLM教程內(nèi)容之上優(yōu)化而成。大咖推薦,口碑保證!
這本書一經(jīng)推出,就受到了吳飛、周明、朱信忠、金耀輝、張俊林5位人工智能領域?qū)<业挠H筆推薦!“這本書是由Datawhale所推出的力作,秉承了Datawhale‘為了學習者’的一貫理念,基于志愿者團隊精彩的開源學習內(nèi)容精心編纂而成,深入淺出地介紹大語言模型的原理和工程實踐,對于初學者了解ChatGPT非常有幫助!”
——吳飛,浙江大學人工智能研究所所長
“書中內(nèi)容圍繞自然語言處理任務展開,很多設計思路和細節(jié)其實可以應用到多個領域。期望讀者多學多練,能夠在實踐中提升自我?!?/span>
——周明,瀾舟科技創(chuàng)始人兼CEO,創(chuàng)新工場首席科學家
“這本書雖然以ChatGPT作為示例,但絕大部分內(nèi)容都可以無縫切換為其他大語言模型。這得益于本書基于以‘自然語言處理算法任務’為核心的設計理念,因而這本書具有更長的生命周期?!?/span>
——朱信忠,浙江師范大學人工智能研究院副院長,浙江省特級專家,Datawhale首席科學家
“這本書以明晰而簡潔的文字,闡述了大語言模型的工作原理,堪稱杰作。更為可貴的是,書中還詳細介紹了ChatGPT的工程實施策略?!?/span>
——金耀輝,上海交通大學人工智能研究院總工程師、教授
“這是一本有關大語言模型應用和服務的實踐指導書,詳細介紹了如何開發(fā)基于大語言模型算法的應用和服務。這本書注重實際任務的設計及實現(xiàn)的思路講解,并提供了對自然語言處理基礎知識和算法原理的科普性介紹?!?/span>
——張俊林,新浪微博新技術研發(fā)負責人
▲ 滑動查看更多 通過上面的介紹以及各位專家的推薦,相信讀者應該對這本書有了初步了解。下面小異再具體說說如何更好地使用本書。如何閱讀本書?
第一,讀者可以先行了解第1章進行一個科普入門。
書籍后面的內(nèi)容根據(jù)內(nèi)容規(guī)模和難度,講解順序重新排列為:相似匹配、句詞分類、文本生成、復雜推理......讀者可以按部就班地學習,也可以根據(jù)自己的興趣選擇任意章節(jié)進行學習。因為各章節(jié)相對獨立,彼此沒有直接明顯的前后依賴關系,在學習時可以靈活調(diào)整。
第二,以“任務”為核心。
本書注重“任務”多于“工具” ,雖然ChatGPT 是目前大語言模型領域總體效果最好的,但未來一定會有其他更好的大語言模型出現(xiàn)。書中詳細介紹了與NLP相關的任務(如相似匹配、句詞分類、文本生成、復雜推理)的背景和系統(tǒng)設計,這些方法也適用于其他大模型。只要讀者理解了要做的事情,理解了系統(tǒng)設計,工具就能為我們所用。第三,利用好本書內(nèi)容、提供的思維導圖、GitHub開源項目HuggingLLM、B站視頻課程等各種資源,來全方位地助力自己的學習與實踐。
· GitHub開源項目HuggingLLM鏈接是datawhalechina/hugging-llm: HuggingLLM, Hugging Future. (github.com)
· B站視頻課程鏈接是學會如何使用大模型,讓創(chuàng)意有能力落地成應用:HuggingLLM,Hugging未來_嗶哩嗶哩_bilibili
第四,一定要親自動手完成一個應用或服務的 Demo!
你可以在書中找到詳細的示例代碼,稍做修改后就可以在實際環(huán)境中使用。光看不做在編程領域是絕對行不通的,只是想想或者口頭上說與親自動手完全是兩回事。萬事開頭難,但一旦完成了第一個項目,后面再做類似的就會相對容易一些。所以大膽地實操吧! 另外要說明的是,這本書不是特別為算法或者自然語言處理工程師等行業(yè)人員設計的。當然,如果你是NLP工程師,也可以通過這本書受益。這本書更適合以下人員:
· 對ChatGPT感興趣的人;
· 希望實際運用這項技術來創(chuàng)造新的服務或者解決現(xiàn)有問題的人;
· 有一定編程基礎的人。
結(jié)語
本書的封面上有一幅幅蝴蝶圖案,這是因為作者們相信人工智能將會涌現(xiàn)出更多美麗的形態(tài),恰如蝴蝶從蛹中蛻變一樣,這也寓意希望讀者閱讀本書后將有嶄新的領悟。趕緊拿起這本“蝴蝶書”,開啟你的全新認知之旅吧!滑動查看更多
DataWhale好書推薦
01
機器學習公式詳解 第2版
▼ 點擊下方即可購書,限時特惠 5折
02
pandas數(shù)據(jù)處理與分析
▼ 點擊下方即可購書,限時特惠 5折
本書基于pandas官方推薦的中文教程“Joyful Pandas”編寫,是以實戰(zhàn)為中心的pandas教程。
本書基于作者自身學習pandas的切身經(jīng)驗,在對pandas龐雜內(nèi)容的主線認真梳理之后,他整理出一條由淺入深、適合初學者的學習路線。本書能讓初學者擺脫常規(guī)學習pandas的痛苦,從核心概念開始學習,理解函數(shù)之間的邏輯關系,建立起數(shù)據(jù)處理的宏觀體系,真正快樂地學會pandas。
03
Easy RL 強化學習教程
▼ 點擊下方即可購書,限時特惠 5折
同樣出自Datawhale的“蘑菇書”《Easy RL 強化學習教程》是一本真真切切的學霸筆記,三位作者王琦、楊毅遠、江季分別是中國科學院大學、清華大學、北京大學的相關專業(yè)碩士研究生。
作者把自己學習強化學習過程中的想法、思路、難點、技巧等整理成教程,分享給更多的人,通過數(shù)千人的使用學習獲取反饋再仔細作補充與修改,經(jīng)過一年多的持續(xù)優(yōu)化,最終形成了這本“蘑菇書”。
