您的位置:光电产业平台  >  安防  >  大模型算法:强化学习、微调与对齐 详解强化学习 RLHF GRPO DPO SFT CoT DeepSeek蒸馏 微调与对齐 效果优化及其实践

大模型算法:强化学习、微调与对齐 详解强化学习 RLHF GRPO DPO SFT CoT DeepSeek蒸馏 微调与对齐 效果优化及其实践 - 臣马图书音像专营店

券后价¥55 领优惠券 ¥ 1

原价:56元9.82折 距离结束:

去天猫抢购>> 收藏

扫码有惊喜!

扫码进入手机查看
  • 宝贝详情

HOT同类热卖

    L
    o
    a
    d
    i
    n
    g
    .
    .
    .

扫描二维码打开

周一至周六

9:00-22:00                  

光电产业平台    Copyright © 2010 - 2019 http://yaxfjc.yuncomcn.com/ All Rights Reserved