本文来自微信公众号:特大号 (ID:ITXXXL),作者:小黑羊,题图来自:视觉中国


今年大模型实在太火,如何打造一个拖垮公司的大模型?


不多不少,一共分10步。


第一步:先砸十个亿买卡


做大模型,要有大格局,舍不得孩子套不着狼。



什么X100、Y100……专挑算力强的买。



正规渠道没货了?不能怂!加价也要整起来。



第二步:从顶流公司挖大牛来坐镇首席科学家


必须是业界扛把子级别的大牛,就职于顶流AI公司比如“CloseAI”,经常在各种会议上高光出镜的那种。



能把整个团队都带过来最好,成建制、好管理、出活儿快。



第三步:定战略,当卷王


模型参数至少要万亿级别,当不成卷王,就只能被卷死。



再来个“智算中心”,算力至少达要1000PFLOPS,自己训练完大模型,还能把算力开放出来给同行。



第四步:万事开头难,从数据准备开始全员鸡血加班


数据不够怎么整?公开一部分,自有一部分,交易一部分。



拿到数据后,得清洗处理,全体动员做标注,老板亲自下场,主打一个陪伴。



第五步:开始玩命训练,不出意外的话快出意外了


服务器挂了、存储速度跟不上了、跨卡性能不行、梯度消失、梯度爆炸……



什么?!Checkpoints没保存?反复回退,反复调参,反复排雷。



第六步:内部开始自我修正


问题一多,团队就乱了,人都变得很浮躁。



公司原有的主营业务停滞不前,业绩下滑。



第七步:不管产品行不行,市场宣传要先行一步


“我们来了!”广告要全渠道、全媒体覆盖。



必须要业界感知到我们来势汹汹的霸气。



第八步:生态伙伴少不了,气氛必须搞起来


先结盟5000家合作伙伴,达成意向合作。



第二天,大家联合发发新闻稿,必须让吃瓜群众充满期待。



第九步:大模型终于“练”出来了


练是练出来了,看上去有点不对劲,莫不是个“大傻子”吧?



落地实施,那叫一个难,不知道给谁用,不知道往哪儿用。



第十步:及时止损,人间清醒



然后开始复盘,多么痛的领悟~



大牛来了又走了,算力卡买了又卖了,智算中心建了又拆了,大模型炼了又废了。



本文来自微信公众号:特大号 (ID:ITXXXL),作者:小黑羊