RedPajama大語(yǔ)言模型

聯(lián)合創(chuàng)作 · 2023-09-25 23:18

RedPajama 項(xiàng)目旨在創(chuàng)建一套領(lǐng)先的全開(kāi)源大語(yǔ)言模型。目前，該項(xiàng)目已完成了第一步，成功復(fù)制了 LLaMA 訓(xùn)練數(shù)據(jù)集超過(guò) 1.2 萬(wàn)億個(gè)數(shù)據(jù) token。該項(xiàng)目由Together、Ontocord.ai、ETH DS3Lab、斯坦福大學(xué) CRFM、Hazy Research 和 MILA 魁北克 AI 研究所聯(lián)合開(kāi)發(fā)。

RedPajama 包含三個(gè)主要組成部分：預(yù)訓(xùn)練數(shù)據(jù)、基礎(chǔ)模型和指令調(diào)優(yōu)數(shù)據(jù)與模型。

瀏覽 18

點(diǎn)贊

收藏

分享

舉報(bào)

評(píng)論

圖片

表情

RedPajama大語(yǔ)言模型

RedPajama項(xiàng)目旨在創(chuàng)建一套領(lǐng)先的全開(kāi)源大語(yǔ)言模型。目前，該項(xiàng)目已完成了第一步，成功復(fù)制了LLaMA訓(xùn)練數(shù)據(jù)集超過(guò)1.2萬(wàn)億個(gè)數(shù)據(jù)token。該項(xiàng)目由Together、Ontocord.ai、E

OPT-175B大語(yǔ)言模型

OPT-175B 是 Meta 開(kāi)源的大語(yǔ)言模型，擁有超過(guò) 1750 億個(gè)參數(shù)——和 GPT-3 相

OPT-175B大語(yǔ)言模型

OPT-175B是Meta開(kāi)源的大語(yǔ)言模型，擁有超過(guò)1750億個(gè)參數(shù)——和GPT-3相當(dāng)。相比GPT-3，OPT-175B的優(yōu)勢(shì)在于它完全免費(fèi)。Meta還公布了代碼庫(kù)、開(kāi)發(fā)過(guò)程日志、數(shù)據(jù)、研究論文和其

LLaMA大語(yǔ)言模型

LLaMA語(yǔ)言模型全稱(chēng)為"LargeLanguageModelMetaAI"，是Meta的全新大型語(yǔ)言模型（LLM），這是一個(gè)模型系列，根據(jù)參數(shù)規(guī)模進(jìn)行了劃分（分為70億、130億、330億和650億

LLaMA大語(yǔ)言模型

LLaMA 語(yǔ)言模型全稱(chēng)為 "Large Language Model Meta AI"，是 Met

BBT-2通用大語(yǔ)言模型

BBT-2 是包含 120 億參數(shù)的通用大語(yǔ)言模型，在 BBT-2 的基礎(chǔ)上訓(xùn)練出了代碼，金融，文生

BBT-2通用大語(yǔ)言模型

BBT-2是包含120億參數(shù)的通用大語(yǔ)言模型，在BBT-2的基礎(chǔ)上訓(xùn)練出了代碼，金融，文生圖等專(zhuān)業(yè)模型。基于BBT-2的系列模型包括：BBT-2-12B-Text：120億參數(shù)的中文基礎(chǔ)模型BBT-2

ChatYuan對(duì)話語(yǔ)言大模型

ChatYuan是一個(gè)支持中英雙語(yǔ)的功能型對(duì)話語(yǔ)言大模型。ChatYuan-large-v2使用了和v1版本相同的技術(shù)方案，在微調(diào)數(shù)據(jù)、人類(lèi)反饋強(qiáng)化學(xué)習(xí)、思維鏈等方面進(jìn)行了優(yōu)化。ChatYuan-la

CodeFuse-13B代碼大語(yǔ)言模型

CodeFuse-13B是基于GPT-NeoX框架訓(xùn)練的13B參數(shù)代碼生成模型，能夠處理4096個(gè)字

CodeFuse-13B代碼大語(yǔ)言模型

CodeFuse-13B是基于GPT-NeoX框架訓(xùn)練的13B參數(shù)代碼生成模型，能夠處理4096個(gè)字符的代碼序列。該模型在1000BToken的代碼、中文、英文數(shù)據(jù)數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練，覆蓋超過(guò)40種編

點(diǎn)贊

收藏

分享

舉報(bào)

少妇高潮zzzzzzzy一avhd | 色天天综合网 | 六月婷婷一区二区三区 | 久久婷婷秘精品国产538 | 色老板最新地址 |