一区二区三区在线播放,黄色av免费在线观看,全国最大成人免费视频,日本高清视频色,日韩少妇精品av一区二区,久久久久亚洲精品国产,久久精品在线视频,国产欧美精品一区aⅴ影院

    昆侖萬維開源2千億稀疏大模型天工MoE,全球首創能用4090推理

    2024年6月3日,昆侖萬維宣布開源 2 千億稀疏大模型 Skywork-MoE , 性能強勁, 同時推理成本更低。Skywork-MoE 基于之前昆侖萬維開源的 Skywork-13B 模型中間 checkpoint 擴展而來,是首個完整將 MoE Upcycling 技術應用并落地的開源千億 MoE大模型,也是首個支持用單臺 4090 服務器推理的開源千億 MoE大模型。

    開源地址:

    Skywork-MoE 的模型權重、技術報告完全開源,免費商用,無需申請:

    ? 模型權重下載:

    ? https://huggingface.co/Skywork/Skywork-MoE-base

    ? https://huggingface.co/Skywork/Skywork-MoE-Base-FP8

    ? 模型開源倉庫:https://github.com/SkyworkAI/Skywork-MoE

    ? 模型技術報告:https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdf

    ? 模型推理代碼:(支持 8x4090 服務器上 8 bit 量化加載推理) https://github.com/SkyworkAI/vllm

    模型架構:

    本次開源的 Skywork-MoE 模型隸屬于天工 3.0 的研發模型系列,是其中的中檔大小模型(Skywork-MoE-Medium),模型的總參數量為 146B,激活參數量 22B,共有 16 個 Expert,每個 Expert 大小為 13B,每次激活其中的 2 個 Expert。

    天工 3.0 還訓練了 75B (Skywork-MoE-Small) 和 400B (Skywork-MoE-Large)兩檔 MoE 模型,并不在此次開源之列。

    模型能力:

    我們基于目前各大主流模型評測榜單評測了 Skywork-MoE,在相同的激活參數量 20B(推理計算量)下,Skywork-MoE 能力在行業前列,接近 70B 的 Dense 模型。使得模型的推理成本有近 3 倍的下降。同時 Skywork-MoE 的總參數大小比 DeepSeekV2 的總參數大小要小 1/3,用更小的參數規模做到了相近的能力。

    技術創新:

    為了解決 MoE 模型訓練困難,泛化性能差的問題,相較于 Mixtral-MoE, Skywork-MoE 設計了兩種訓練優化算法:

    1. Gating Logits 歸一化操作

    我們在 Gating Layer 的 token 分發邏輯處新增了一個 normalization 操作,使得 Gating Layer 的參數學習更加趨向于被選中的 top-2 experts,增加 MoE 模型對于 top-2 的置信度:

    2. 自適應的 Aux Loss

    有別于傳統的固定系數(固定超參)的 aux loss, 我們在 MoE 訓練的不同階段讓模型自適應的選擇合適的 aux loss 超參系數,從而讓 Drop Token Rate 保持在合適的區間內,既能做到 expert 分發的平衡,又能讓 expert 學習具備差異化,從而提升模型整體的性能和泛化水平。在 MoE 訓練的前期,由于參數學習不到位,導致 Drop Token Rate 太高(token 分布差異太大),此時需要較大的 aux loss 幫助 token load balance;在 MoE 訓練的后期,我們希望 Expert 之間仍保證一定的區分度,避免 Gating 傾向為隨機分發 Token,因此需要較低的 aux loss 降低糾偏。

    訓練 Infra

    如何對 MoE 模型高效的進行大規模分布式訓練是一個有難度的挑戰,目前社區還沒有一個最佳實踐。Skywork-MoE 提出了兩個重要的并行優化設計,從而在千卡集群上實現了 MFU 38% 的訓練吞吐,其中 MFU 以 22B 的激活參數計算理論計算量。

    1. Expert Data Parallel

    區別于 Megatron-LM 社區已有的 EP(Expert Parallel)和 ETP(Expert Tensor Parallel)設計,我們提出了一種稱之為 Expert Data Parallel 的并行設計方案,這種并行方案可以在 Expert 數量較小時仍能高效的切分模型,對 Expert 引入的 all2all 通信也可以最大程度的優化和掩蓋。相較于 EP 對 GPU 數量的限制和 ETP 在千卡集群上的低效, EDP 可以較好的解決大規模分布式訓練 MoE 的并行痛點,同時 EDP 的設計簡單、魯棒、易擴展,可以較快的實現和驗證。

    一個最簡單的 EDP 的例子,兩卡情況下 TP = 2, EP = 2, 其中 Attention 部分采用 Tensor Parallel , Expert 部分采用 Expert Parallel

    2. 非均勻切分流水并行

    由于 first stage 的 Embedding 計算和 last stage 的 Loss 計算,以及 Pipeline Buffer 的存在, 流水并行下均勻切分 Layer 時的各 stage 計算負載和顯存負載均有較明顯的不均衡情況。我們提出了非均勻的流水并行切分和重計算 Layer 分配方式,使得總體的計算/顯存負載更均衡,約有 10% 左右的端到端訓練吞吐提升。

    比較均勻切分和非均勻切分下的流水并行氣泡:對于一個 24 層 Layer 的 LLM, (a) 是均勻切分成 4 個 stage,每個 stage 的 layer 數量是:[6, 6, 6, 6].(b) 是經過優化后的非均勻切分方式,切成 5 個 stage, 每個 stage 的 layer 數量是:[5, 5, 5, 5, 4] , 在中間流水打滿的階段,非均勻切分的氣泡更低。

    MoE Know-how

    此外,Skywork-MoE 還通過一系列基于 Scaling Laws 的實驗,探究哪些約束會影響 Upcycling 和 From Scratch 訓練 MoE 模型的好壞。

    一個可以遵循的經驗規則是:如果訓練 MoE 模型的 FLOPs 是訓練 Dense 模型的 2 倍以上,那么選擇 from Scratch 訓練 MoE 會更好,否則的話,選擇 Upcycling 訓練 MoE 可以明顯減少訓練成本。

    4090 推理

    Skywork-MoE 是目前能在 8x4090 服務器上推理的最大的開源 MoE 模型。8x4090 服務器一共有 192GB 的 GPU 顯存,在 FP8 量化下(weight 占用 146GB),使用我們首創的非均勻 Tensor Parallel 并行推理方式,Skywork-MoE 可以在合適的 batch size 內達到 2200 tokens/s 的吞吐。天工團隊完整開源了相關的推理框架代碼和安裝環境,詳情參見:https://github.com/SkyworkAI/Skywork-MoE

    結語

    我們希望本次開源的 Skywork-MoE 模型、技術報告和相關的實驗結果可以給開源社區貢獻更多的 MoE 訓練經驗和 Know-how,包括模型結構、超參選擇、訓練技巧、訓練推理加速等各方面, 探索用更低的訓練推理成本訓更大更強的模型,在通往 AGI 的道路上貢獻一點力量。

    編輯:gloria
    AI 文章概述
    *本回答由 AI 生成,僅供參考,不構成任何專業建議。
      熱門新聞
        24小時熱榜
        日榜 | 周榜
            主站蜘蛛池模板: 国产无遮挡又黄又爽又色视频| 国内精品在线免费| 精品国产乱码久久久久久久久| 国内揄拍国产精品| 国产日韩一区在线| 少妇高潮一区二区三区99小说| 欧美一区二区三区片| 国产午夜三级一二三区| 国产日韩精品一区二区| 麻豆国产一区二区| 日韩精品一区在线观看| 福利片午夜| 在线观看欧美一区二区三区| 亚洲欧美日韩精品suv| 国产二区不卡| 国产日本欧美一区二区三区| 久久精品爱爱视频| 午夜剧场一区| 高清国产一区二区三区| 浪潮av色| 狠狠色噜噜狠狠狠狠色综合久老司机| 欧美一区二区三区不卡视频| 国产精品一区在线观看你懂的 | 99re6国产露脸精品视频网站| 亚洲欧美国产精品一区二区| 中文字幕一二三四五区| 性国产日韩欧美一区二区在线| 国产高清精品一区| 91夜夜夜| 日本丰满岳妇伦3在线观看| 亚洲精品久久久久不卡激情文学| 免费观看又色又爽又刺激的视频 | 激情久久一区二区三区| 大bbw大bbw巨大bbb| 久久99精| 国久久久久久| 日韩欧美高清一区二区 | 欧美亚洲视频一区二区| 久久人人97超碰婷婷开心情五月| 午夜爽爽爽男女免费观看| 香蕉av一区二区三区| 国产欧美亚洲精品| 91人人精品| 欧美高清视频一区二区三区| 国产在线精品一区| 日韩午夜毛片| 李采潭无删减版大尺度| 国产九九影院| 国产精品欧美一区乱破| 亚洲网站久久| 91久久久爱一区二区三区| 一区二区在线精品| 亚洲国产精品入口| 国产韩国精品一区二区三区| 国产一区二区三区四区五区七| 国产主播啪啪| 视频一区欧美| 欧美777精品久久久久网| 年轻bbwwbbww高潮| 国产一区二区手机在线观看| 国产精品一区在线播放| 午夜精品一区二区三区在线播放| 精品一区电影国产| 欧美3p激情一区二区三区猛视频| 91亚洲欧美日韩精品久久奇米色| 国产69精品久久久久999天美| 久久一级精品| 午夜看大片| 香蕉视频一区二区三区| 四虎国产永久在线精品| 国产69精品久久久久按摩| 久久国产精品首页| 日韩a一级欧美一级在线播放| 国产1区2| 天天射欧美| 亚洲国产精品综合| 午夜剧场a级片| 国产99视频精品免视看芒果| 国产精品一区二区三区在线看| 午夜国产一区| 视频一区二区三区欧美| 国产精品一区二区免费视频| 正在播放国产一区二区| 亚洲三区在线| 亚洲精品卡一卡二| 久久激情图片| 精品国产一区二区三区忘忧草| 国产精品亚洲精品| 精品999久久久| 欧美日韩国产精品一区二区| 国产91一区二区在线观看| 日韩欧美中文字幕精品| 国产女人好紧好爽| av午夜电影| 欧美亚洲精品一区二区三区| 精品一区欧美| 午夜影院h| 欧美在线视频一二三区| 亚洲精品国产精品国产| 欧美极品少妇| 亚洲精品久久久久玩吗| 一区二区中文字幕在线观看| 亚洲欧美国产中文字幕| 狠狠躁狠狠躁视频专区| 日本一区二区三区电影免费观看| 亚洲欧美色一区二区三区| 精品一区二区三区影院| 色乱码一区二区三在线看| 久久99精品国产一区二区三区| 欧美日韩一级二级三级| 91一区二区三区在线| 国产一区在线免费| 国产69精品久久久久久久久久| 国产精品一二三区免费| 国产日韩欧美综合在线| 日本午夜精品一区二区三区| 99久久婷婷国产综合精品草原 | 亚洲国产精品日本| 日韩亚洲精品视频| 躁躁躁日日躁网站| 亚洲精品丝袜| 91精品国产综合久久福利软件| 国产乱了高清露脸对白| 亚洲欧洲日本在线观看| 国产精品久久人人做人人爽| 99国产精品久久久久99打野战| 日韩精品一区二区三区在线| 国产又黄又硬又湿又黄| 93久久精品日日躁夜夜躁欧美| 国产欧美一区二区在线观看| 午夜av免费看| 国产一区二区三区在线电影| 99国产精品一区| 99精品国产免费久久| 伊人av中文av狼人av| 中文字幕一区2区3区| 91丝袜国产在线播放| 国产精品一区二区免费视频| 综合欧美一区二区三区| 国产亚洲精品久久久456| 国产乱一乱二乱三| 少妇厨房与子伦在线观看| 片毛片免费看| 亚洲精品卡一卡二| 欧美性xxxxx极品少妇| 国产亚洲精品久久久久动| 精品久久久综合| 国产一区网址| 国产精品久久久久四虎| 欧美一区二区免费视频| 国产区精品| 国产精品午夜一区二区| 国产精品女同一区二区免费站| 日韩一区二区三区福利视频| 综合久久一区二区三区| 日韩av在线播| 亚洲国产精品激情综合图片| 国产精品二区在线| 国产精品刺激对白麻豆99| 亚洲二区在线播放视频| 99国精视频一区一区一三| 国产日韩欧美精品一区| 国产网站一区二区| 国产99小视频| 91麻豆精品国产91久久久无限制版| 91avpro| 久久久久国产亚洲| 欧美一级不卡| 国产亚洲精品久久午夜玫瑰园| 激情久久精品| 欧美一区二区三区激情| 91久久国语露脸精品国产高跟| 午夜欧美影院| 欧美一区二区三区免费电影| 久久青草欧美一区二区三区| 亚洲精品国产主播一区| 香蕉av一区| 精品无人国产偷自产在线| 久久激情综合网| 国产精品乱码一区二区三区四川人 | 午夜在线看片| 亚洲w码欧洲s码免费| 日本一二三不卡| 亚洲精品乱码久久久久久麻豆不卡| 日韩av中文字幕一区二区| 亚洲国产精品综合| 99精品小视频| 97人人模人人爽人人喊38tv| 欧美日韩中文字幕一区| 欧洲激情一区二区| 国产一二区视频| 欧美一区二区三区性| 国产欧美一区二区三区四区| 亚洲激情中文字幕| 国产无遮挡又黄又爽又色视频| 福利片午夜| 亚洲午夜精品一区二区三区电影院| 国产伦精品一区二区三区免费下载| 国产精品视频久久久久| 欧美国产亚洲精品| 十八无遮挡| 欧美日韩国产精品一区二区| 国产精品理人伦一区二区三区| ass韩国白嫩pics| 国产欧美日韩一级| 日本一区二区在线观看视频| 91偷自产一区二区三区精品| 日本一区二区免费电影| 国产999久久久| 亚洲一区二区福利视频| 国产精品久久久久久久久久久新郎| 精品久久9999| 久久久久久久国产| 国产偷久久一区精品69| 午夜特片网| 欧美日韩三区二区| 午夜大片网| 欧美一级久久精品| 浪潮av色| 狠狠躁夜夜躁2020| 性xxxxfreexxxxx交| 91福利试看| 国产精品久久久麻豆| 日韩毛片一区| 91精品国产高清一二三四区| 国产一区二区三区在线电影| 日韩a一级欧美一级在线播放| 美国一级片免费观看| 国产一区二区精品免费| 99国产精品丝袜久久久久久| 精品videossexfreeohdbbw| 91亚洲欧美强伦三区麻豆| 国产欧美亚洲一区二区| 精品国产一区二区三区在线| 午夜一区二区视频| 一区二区在线国产| 亚洲五码在线| 免费a级毛片18以上观看精品| 国产在线精品一区| 91国偷自产中文字幕婷婷| 欧美一区二区三区国产精品| 欧美精品一区二区三区视频| 91精品福利观看| 欧美国产一区二区三区激情无套| 欧美一区二区三区久久久久久桃花 | 91精品久久久久久|