跳轉至主要內容
行情
掃鏈
策略
追蹤
追蹤聰明錢地址,實時監控動態
跟單
探索鏈上交易,一鍵跟單獲取收益
信號
關注聰明錢信號,發現早期機會
兌換
資產
邀請計劃
OnchainOS
開發者中心
文檔
API Key 管理
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
區塊鏈瀏覽器
更多
DeFi
市場
安全中心
Boost
X Launch
參與 X Launch,搶先賺新幣
X Campaign
參與活動,贏取豐厚獎勵
獎勵中心
領取獎勵和空投
預警
語言
貨幣
DEX 功能
顏色設置
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
學院
幫助中心
返回
自動翻譯代幣名稱
自動翻譯 X 內容
懸停顯示代幣卡片
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-5.07%
USELESS
-7.75%
IKUN
-11.61%
gib
-3.68%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-4.6%
ALON
-6.97%
LAUNCHCOIN
+0.54%
GOONC
-6.3%
KLED
-15.78%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.01%
Boopa
-7.34%
PORK
0.00%
主頁
Nathan Barry
知識盜竊狂。之前@Apple,CS + 數學@UTAustin,@zfellows
查看原文
Nathan Barry
2025年10月23日
正在嘗試訓練一個小型的 11M 參數字符級文本擴散模型! 這是一個正在進行中的項目,但目前的代碼是對 nanochat gpt 實現的重度修改版(將自回歸解碼更改為擴散),並且是基於 Tiny Shakespeare 數據集進行訓練的。 簡單的遮罩計劃實現是對每個迭代中的每個標記使用均勻的遮罩概率。更新的方法是從左到右以塊狀進行遮罩,這樣可以提高輸出質量並允許某些 KVCache 的重用。 我意識到在生成過程中實際上可以以任何任意方式應用遮罩。下面你可以看到我根據康威的生命遊戲的規則應用了遮罩。 我想知道是否有任何不尋常的遮罩策略可以提供好處。無論如何,這是一種非常有趣且令人著迷的方式來破壞和變形文本。
724
Nathan Barry
2025年10月21日
BERT 只是一個單一的文本擴散步驟! (1/n) 當我第一次讀到語言擴散模型時,我驚訝地發現它們的訓練目標只是掩蔽語言模型(MLM)的概括,這是我們自 2018 年以來一直在做的事情。 我第一個想到的問題是:"我們能否微調一個類似 BERT 的模型來進行文本生成?"
738
Nathan Barry
2025年10月17日
研究日誌 第0天:DiLoCo日 我決定圍繞分散式低通訊訓練撰寫論文。基本上,我們如何能夠在分散的節點上有效地訓練大型模型,而不會被網路延遲和帶寬完全摧毀? (1/n)
743
熱門
排行
收藏