返回 相似
资源描述:
http//research.meritco-group.com 久谦 | 服务进步的群体 | 1 ChatGPT 第二批 纪要合集 ChatGPT的发展前景 2 ChatGPT对国内产业的影响 9 ChatGPT发展路径和竞争力 17 ChatGPT技术壁垒 和国产替代 19 投资人谈 ChatGPT 24 ChatGPT算力知多少 29 ChatGPT算力需求测算 32 ChatGPT开启 AI新纪元 . 37 ChatGPT掀起 AI产业新周期 . 40 汤姆猫访谈纪要 . 42 微软加速 ChatGPT落地 . 44 小冰访谈纪要 . 47 中文在线访谈纪要 . 49 数码视讯访谈纪要 . 50 汉王科技访谈纪要 . 53 科大讯飞值得关注的 AI应用方向 56 同花顺 AI应用方向 65 起点财经 GPT ChatGPT不会淘汰你 先驾驭ChatGPT的人会淘汰你 识别二维码查看详情 1 2 各路大神 畅聊AI 使用指南和落地应用,分享商业化 案例,碰撞思维火花 定时分享AI智能、ChatGPT、AIGC、GPT-4等 最新研报 和相关资讯 ChatGPT限时免费 初体验提供GPT免费互动 提问1个月目前开放的API为3.5版本) 一次性领取 649份 ChatGPT、AIGC 相关资料 , 资料持续更新中 3 4 http//research.meritco-group.com 久谦 | 服务进步的群体 | 2 ChatGPT的发展前景 2/14 核心观点 1 AI行业还是在成长期,目前在 A股的投资更多还是主题投资阶段。今年科技一定 是会有持续行情 2 深层次 AI行业里面,大概是四类角色 3 AIGC投资可以关注四个层面 4 现在 AI行业有点像五年前甚至十年前的新能源行业 5 未来买数字化,很多时候你可能也要买传统行业的公司,它会是一种双向奔赴 6 科技股未来投资方向,最看好还是数字经济方向,分两块 ChatGPT是当下大热的一个话题,国外的相关公司可能领先了小半年,他们的发展情 况或者他们各自有什么样的特点、优势,可以大概给我们分享一下吗 1 这个爆款的应用来自于 OPENAI,它最早创始的时候,包括像马斯克等很多美国科 技巨头参与在其中,而且它甚至不以盈利为目的,是一个类似于科研类的组织 a 后来微软看到它的发展非常好,实际上最近也有再投入。所以它跟微软自身的 AI在这方面的布局结合的非常紧密。微软后面会推 “全家桶 ”,就是微软将搜索 跟这个相结合,使它变成超级搜索或者超级引擎的落地的场景 b 再包括其实微软最擅长的还是 Office,就是在办公场景下,比如 Word、 Excel,其实我们过去用了很多年的工作习惯很有可能会再有一个大的功能上的 跃升,就是跟 AI相结合。可能我们写作的效率,甚至刚刚谈到的一些题例式 的文章,它都能完成基本撰写 c 像 Office过去也有大量的比如文本校验等功能,但其实还是非常基础的。这次 结合了 AI,它真的就相当于一个审核或者高级校验的角色,比如对你提供一些 数据,逻辑的梳理、验证等等 2 这是微软在这一块儿有很明确 的跟存量的搜索引擎、办公软件相整合,其实它已 经从 AI的模型阶段延伸到应用阶段 a 但是 Google也在推 Bard机器人,后面可能也会正式发布。当然 Google过去 是全球引擎行业的巨头,一直在人工智能方面有非常多的投入,目前它的危机 感也比较强 b 另外对应国内这一块,像百度、阿里、字节都有类似的部署 3 但我自己总结为,在整个深层次 AI行业里面,我觉得大概是四类角色 a 第一是提供底层的基础算力或者云服务的偏硬件层的基础设施,或者云基础设 施的公司。这里面涉及通信或者电子相关的公司会更多一些 b 第二大层是提供大模型或者算法的公司 。 ChatGPT或者 OpenAI是一个非常典 型的做大模型的公司,国外像 OpenAI、 Google会做,当然对应国内像百度、 科大讯飞、阿里,这些科技巨头在大模型方面应该会有一些布局,陆陆续续大 家应该也会看到,这是第二层 c 第三层,就是应该会有一些中间层,稍微偏专业或者垂直侧的小模型的公司。 i 其实国内现在也有一些公司已经开始做,它可能基于第二层的大模型来开 发,但是它用底层开源的大模型在上面再做一个垂直细分领域的优势场 景,比如医生或医疗行业,再比如汽车、法律、律师行业等,就是它可能 会做一些垂直模型 ii 对于第二层和第三 层的关系,大模型更像 K-12(中小学普世义务教育), 是一个基础层的培养,非常重要。如果这 12 年或者这个部分没有做好,上 面很难长出垂直方向很好的模型 http//research.meritco-group.com 久谦 | 服务进步的群体 | 3 iii 到第三层,有点像大学和研究生阶段,可能要选专业,选一个目标培养方 向。这个阶段不太会大而全,比较难有专业优势 iv 国内可能会有很多公司做这一类,但是它也要基于一个大模型,在大模型 的这一端,最终不太会有非常多的公司做,可能会是一个相对更大的,因 为它对算力算法的要求还是蛮高的 d 最后一层量会更大的就是应用层的公司。有点像毕业了,你要工作了,你有了 很好的知识,真的从一个 K-12教育走向大学教育,甚至研究生教育,最后我 要到实践中创造生产力或者创造价值,那可能走向各行各业的 AI的应用。 i 这类公司在国内现在也开始有一些比如游戏行业、搜索引擎,甚至将来的 人形机器人等等,会有很多场景 ii AI有点像五年前甚至十年前的新能源 OpenAI能否成为一个现象级的公司,类似特斯拉,以及由此带来的 AI能够成为类似 新能源行业,它的这个行情将会非常大 1 坦白讲如果现在一定要去判断这两家公司的空间有多大,现在确实还有点早。因 为 OPENAI这家公司最早设立的时候可能不是以盈利商业机构为目的,它更多的还 是在创新上面做探索 a 从这点来看,可能特斯拉创立的开始也是一样,它也要在这种颠覆式创新上有 它的独到之处,或者它设计的初衷就是改变人类现有的对科技的线性的理解。 可能会有第一性原理,就是可能会有一个全新的颠覆式创新,这点是相通的。 b 但是如果从行业的阶段上来比,现在 AI行业跟新能源的成熟度肯定是完全不 同的,有点像五年前甚至十年前的新能源行业 c 当然中间新能源行业也经历过从最早的技术萌芽到产业的成长,像 Gartner曲 线中讲到的任何一种技术至少都会经历五个阶 段,从技术的萌芽到快速成长, 然后到泡沫期,就是资本或者整个创业者会非常疯狂的涌入这个领域,很多技 术都会经历这样的阶段,然后到泡沫的破裂 2 泡沫破裂之后就进入去伪存真,就是真正做这件事情的人可能会留下来。但有时 候最终到这个阶段可能有一些就扛不住、会被淘汰,那才会进入最后一个周期, 就是真正的成熟期。在成熟期,才会有更多的收入、利润、业绩的体现,基本上 都会经历这样五个阶段 a 如果套用这样的模型,毫无疑问特斯拉、新能源行业在今天其实已经走到了相 对比较成熟的阶段,所以它已经在各种财务指标上或者分析师模型里通过销量 或者成本 模型,能够计算或者预测它的利润,然后给予它一个估值去定价 b 但如果回到这个模型, AI现在处在什么阶段,或者 AI不同的决策式、生成式 可能处在不同的阶段,但整体来讲, AI行业还是在成长期。当然,有些部分甚 至可能在泡沫期,就是大家很热的涌到这个领域 c 按照正常的模型,它后面还有三大阶段要走,所以从发展阶段上来讲,跟新能 源行业还是不能相提并论,对应的估值模型肯定也是完全不一样的 3 映射到投资上来看,我个人觉得目前在 A股的投资更多还是主题投资阶段,但主 题投资相对于价值投资并没有更优 a 其实在科技行业,很多新技术一开始都是主题 投资的阶段,因为这个阶段会有 对未来比较大的想象空间,同时行业的竞争格局没有那么固化,这时可选的标 的或者很多公司都会有一种朦胧美,就是我们认为它可能都有做成的可能 b 像电动车行业现在也处在这个阶段,就是你现在还没有分化。但比如消费电子 其实已经有龙头出来了,那我们就要更多关注它的收入、利润。但其实很多产 业现在确实还处在一个板块式的行情中, AI今年应该还是处在这样的阶段。 http//research.meritco-group.com 久谦 | 服务进步的群体 | 4 c 所以对应到投资机会上或者从 OpenAI自身来讲,影响估值的更多的可能不是 它的收入、利润 当前我们应该看什么指标因为对于成长性公司的股指,可能您在 TMT领域还是非 常驾轻就熟的,但是对于一些比如偏重于成熟型公司投资的投资人来说,可能还不是 太了解 1 其实在主题阶段,其实最近这个行情之所以能一直持续,跟海外巨头持续在这个 部分有很多动作有很大关系 a 比如微软会再投 100亿美金进去,但实际上除了微软之外, Google马上也会 动起来,它也要发它的模型,然后也没有商业化计划,同时别的产业链上下游 的巨头其实也都在动。国内也一样,像百度三月份也会推出 “文心一言 ” b 这可能对行情都会有一个持续的催化,就是从主题上来讲 它需要持续有新的东 西,但是短期可能在 PE和 PS上不一定有很明确的指向,但是它也有可能会在 比如用户量上有进一步的跃升 c 包括 OpenAI自身在这个阶段还没有推专门的付费版本,我个人觉得可能未来 会有两种收费模式。一种是对于中小企业来讲,更多的是用云端调用它的接 口;另一种是对于大型企业,它可以本地化部署,这样我也可以直接付费或直 接收费。所以整体来讲,从爆款的应用到用户的暴增到收入阶段,还是能看到 的 2 最怕的是对于一个初创型的行业,大家一定要看利润,反过来对于一个很成熟的 行业,大家又觉得可以看商业模式或者数据,实际上还 是要用适宜它的方法去给 它估值,其实还要有多样化的审美,这也是注册制以后可能 A股要面临的,在科 技投资方面非常重要 AIGC可想象的空间很大,但如果从投资角度来看我们可以提前布局,将来可以关注 哪些投资方向 1 可能有这几个层面,倒着来看还是可以从刚刚提到的四个层面来理解。它是一个 “倒金字塔 ”的结构,就是越往应用层越分散,应用层面应该是百花齐放的,它可 以容纳很多小公司,这个行业集中度不会太高,这是第一大类 2 第二层就是在 “小模型 ”这一层,或者比喻为上大学和研究生的阶段训练。这个部 分应该会有很多大公司做,但很多有数据、 有场景优势的公司也可以做 a 比如我在图片行业或者音乐行业有大量的版权、原始数据,那它可能也会有, 因为这个板块相关公司的核心壁垒第一个肯定要有基础的算法优势,但更重要 的是它要有数据,就是要有很多原创数据 b 那就去挖掘哪些是有场景、有数据的公司,这部分也有投资机会 3 第三层就是 “大模型 ”,前面也有提到,这里就不再展开 4 第四层,就是提供底层算力、云基础和相关支撑的公司 5 2022年年初,国务院发了一个有关数字经济十四五规划。 “十四五 ”规划中在对数 字经济定义时提到 “数据要素是核心生产力 ”,这就有点像 “未来的石油 ”,我可以通 过石油加工出很多如尼龙、化工行业的东西,未来数据也一样 a 所以从这点来讲,提供底层算力的公司可能不会是涉及面很多的公司,因为它 是一个门槛相对比较高的行业,现在像做云计算、做通信、做技术支持服务还 是一些大公司或国资类的公司比较多,但是它的确定性会很高 b 底层有关的这种 “云 ”,不管是 IDC服务、网络服务、提供 ICT设备,甚至是 CPU和 GPU(芯片)都会受益。它可能没有前面提到的那些应用、做模型的公 司那么直接,但反过来讲,它的确定性会很高。工业数字化投资确定性很高, 未来传统行业公司也要买 http//research.meritco-group.com 久谦 | 服务进步的群体 | 5 在数字经济发展中, 新型的基础设施建设、硬件设备、软件开发、应用场景可能都有 爆发点,哪些领域有望率先突破 1 未来十年,数字经济最根本的是把数据作为生产的一个要素,把 AI作为生产工 具,这跟过去十年不同,过去十年是网络和信息化 a 如果这样,我认为首先在应用端或者未来最重要的抓手应该是谁能把数据用 好,谁能用 AI的工具创造新的生产模式或新的应用场景,这是数字经济的最 根本 b 当然,数字化的前提是云化。云化就是如果它都没有上云,数据都是离线的, 或者生产数据、管理数据可能没有全部在线或在云上,这很难称之为数字化企 业,所以从这点来讲,云计算肯定还是确定性很大的。所以这两年云背后包括 存储、服务器,实际上是对算力的支撑 2 另外在数字化投资里,各地有各种东西出来可能和过去十年还会有很大不一样。 过去十年,互联网时代更多的是 TOC的场景比较成功, C是 “CONSUMER”,就是更 多改变我们的生活,比如社交、电商还是对生活质量的提升,让我们的生活更加 便利 3 但未来十年在数字化里面,本质上还是 TOB的场 景, B就是生产,实际上会对它 有更大的跃升,比如数字化在智能制造,在制造业里面对降本增效的效果。现在 对企业来讲,数字化可能不是一个选择题,而是一个必修题,就是如果你不做, 可能未来你的商业模式就要被干掉 4 在过去一段时间,汽车行业就是非常典型的,电动车来了以后,汽车供应链都重 组了。汽车供应链以前都讲 TIER1供应商,但它不是一个垂直化的、定制的生产 模式,这就是一个很传统的制造业生产模式的改变 a 汽车可能不是最后一个在能源行业的数字化行业,我们当时研究数字化场景时 发现一个很有趣的现象,就是越集中度高、越传统的行业反而 越容易数字化, 而供给侧改革过的行业会更容易数字化,为什么 b 因为它的行业结构相对巨头林立,产业分工很清晰。比如煤炭、钢铁、有色拥 抱数字化的态度非常积极,行业竞争格局已经很清晰 c 想再提效率或者有增长,那就要有新的工具和技术手段。反而对于一些比较分 散或者集中度没那么高的行业,比如医药行业好像就没有那么快,因为它的中 间环节还很多 d 这是汽车能源,当然中国还有一块非常大的机会就是工业,就是去年二十大报 告提到的新型工业化。新型工业化的背后,工业数字化就是很大一块,在投资 上的确定性都很高 e 所以我去年提出一个观点,以前投数字化或者投科技就是投 TMT行业本身, 大家去买那些做 IT、做 CT、做芯片的公司。但未来买数字化,很多时候你可 能也要买传统行业的公司,它会是一种双向奔赴 那会不会像我们之前理解的互联网 ,就是在传统行业的颠覆上,互联网这个应用各 个行业都开始了,也颠覆了传统行业,会类似吗 1 会类似,但是我不会用一个词叫 “颠覆 ” a 原来在 ToC的领域 确实是颠覆,就是零售行业做大会对传统的线下零售有很大 影响。但是这次 ToB或者跟很多传统行业的融合, TMT,就是单纯做技术的公 司,还是挺难颠覆的 b 因为在一生产场景,相比于一个消费场景,首先它是非标准化的,就是每个场 景长得都不一样,所以你很难出现一个巨头,在互联网时代赢家通吃 c 但是 ToB不会,比如在制造业和医疗行业可能完全不同,它的 know-how(场 景)完全不同,这个时候如果传统行业的公司能够用好 AI,用好新的数字化工 http//research.meritco-group.com 久谦 | 服务进步的群体 | 6 具,它可能会更有优势 d 数字化可能会成为一个基本工具,所以这点很多传统行业现在还处在估值比较 低 的位置,比如能源行业、工业中也有很多非常优秀的巨头已经开始全面拥抱 数字化 2 过去一年疫情中大家对数字化还是保持非常开放的心态,过去它觉得你要颠覆 我,甚至是一种排斥,现在因为整个经济增速放缓过程中,大家觉得这可能会是 一个非常重要的工具让自己重生,所以企业主愿意在这上面进行投入,它会对整 个行业的推动起到很重要的作用 那会不会在集中度比较高的如国企领域,或者在偏垄断、竞争不激烈的行业率先发 生 1 如果按行业分, TOC先不说,在 TOB的场景因为有很大,更大的如分服务业的数 字化,农业、工业等,稍微小一点工业里面又分很多种 ,但整个研究下来,首先 中国的产业数字化水平比全球低 2 其实就是在 TOC互联网里很发达,在消费部分发达,但是在生产的部分相比于美 国、德国、日本,他们的渗透可能都在 60以上,我们可能只有百分之三十几, 这个本来就是要低一些,所以空间会比较大 3 第二个单就在产业数字化的场景里面,就是 TOB的行业里面,我刚刚举了三个比 较看好的方向 汽车、工业、能源,它的行业集中度相对比较高,对产业链分 工比较清晰,巨头或者龙头对行业的技术和模式创新引领就达成共识,这是比较 好的场景。当然,比如金融行业也在发生类似的事情,也会延伸包括一些 现代服 务业等 在 AI发达的时代,我们如何分享科技股的盛宴。近期在券商的策略会当中,大家集 中看好科技股,科技股也已经有了不小的涨幅,未来您怎么看 1 上次你们办论坛的时候,我其实还是坚定的看好,我当时有三点理由 a 第一个是本身技术变迁到了一个新周期的开始。 TMT的每一轮行情最重要的因 素可能不是估值,因为它足够便宜,当然这肯定是其中一个很重要的因素,但 不是唯一的因素 i 最底层的因素应该是到底有没有质的技术创新,就是现象级的应用,或者 有没有爆款的东西出来。其实 2015年那一波科技行情,移动互联网的爆款 应用出来很多,包括后来像抖音、快手这样爆款的现象级的应用 ii 现在又有现象级的应用出来,而且它到上亿用户的速度可能是历史上最快 的,只用两个月时间,这是一个很重要的标志,就是它需要有全新的、让 人感觉很兴奋的东西出来,而这种东西可能是一个颠覆式的创新,当然过 去几年科技有很多场景有点低预期,那就没有达到想象 iii 但是这次 AI在这个方向其实是有超预期的表现,这是一个很重要的驱动科 技股的因素。当 然,如果基于这个模型,后续还有没有爆款应用出来,是 有可能的 b 第二个影响科技股行情最根本的因素是流动性,我去年提到美联储加息的趋势 停止,其实这也很重要。因为总体来讲,确实在整个估值体系里面,科技股历 来是估值比较贵的,但是它贵背后有一个 “G”( Growth),就是有增长在里面 i 所以我更习惯于去看 PEG,而不是简单的看动态 PE 更有价值。就是相比于 15倍估值,但是只有 15增长的东西,我更愿意选择一个 50 倍估值,但 是有百分之百增长的东西。这是典型的科技研究员的审美,一定是要有增 长、有变化、有未来潜在的非线性的拐点 ii 像当年亚马逊大概有十年只有收入的增长,但 AWS没有利润的增长,但它 一旦开始盈利以后,你会发现收入可能每年增长 50,但利润增长百分之 http//research.meritco-group.com 久谦 | 服务进步的群体 | 7 百,然后毛利率或者利润率有一个边际成本迅速下降,软件、互联网行业 其实都有这样的特点 iii 所以这是第二个审美的重点,就是它今年有一个流动性的优势,同时最新 的流动性的溢价会更直接的体现在科技股上,当然在去年那样反向的时候 就会更痛苦 c 最后一点,从今年整个 A股来看,确实在科技股的投资板块上,估值还是有一 些吸引力。因为从 2018年的四季度应该是一个低点,但经过后来 2019、 2020 年有一轮反 弹,但总体来讲跟 2018年以前还是有差距的 d 就是实际上高的时候看 2018 年之前,像今天很热的计算机行业在火的时候, 实际上也有 50 倍以上的估值中枢的阶段,但是其实我们就觉得 50倍可能很贵 e 相比于 2013、 2014年非常疯狂的阶段,还处于中位数,估值还有一定空间, 没有拥挤到已经泡沫化了,那可能确实后面会比较难 2 所以基于以上三点,今年科技一定是会有持续行情 从这三点来看,或者结合一些历史数据,您觉得科技股的牛市一般会持续多久 1 其实还是取决于前面几个因素,要不断有新东西出来。比如移动互联网,就是 3G 那一波,大概从 2012年游戏作为第一个爆款应用出来到 2015年大概有三、四年 的时间 2 再看 2018年的半导体,其实就是以信创、自主可控为代表,也有差不多三年时 间。当然可能结构会不一样,我以前经常讲 “硬三年,软三年,商业模式再三年 ” 的周期性,过去几年其实更多的还是在硬件上 长期逻辑不看新鲜概念或主题,怎么把握未来 5到 10年科技股的投资方向呢 1 简单总结,我最看好的还是数字经济方向。数字化其实是一个周期比较长、确定 性很高的东西 2 具象一点,可能 有几个板块,数字经济就是两大块 a 第一大块是数字产业化。就是 TMT行业本身会有一些基础设施部分(新基 建),这个部分确定性比较高的像云计算,现在它又是一个需求跃升或者拉动 的过程刚刚开始,对应到不管是做云自身的公司,还是做云基础设施的,像配 套设备或者是里面的芯片、 ICT设备的公司,它会受益 b 第二个在基础设施部分我比较看好的还是大安全的主线 i 现在在科技的自主可控,以及信创,包括网络安全,它是一个不仅仅因为 全球竞争的问题,其实也有应用从 ToC走向 ToB,它自然会对安全的要求 很高 ii 所以在相关的比如网络安全、底层设备的投 入上,它对安全的要求就会更 高,从这点上信创板块应该还有确定的机会 c 最后就是在产业数字化方面,在应用端下一个爆款的应用会在哪里,这也是大 家所关注的。但整体来讲,可能 ToB的机会会大一些 d 这三类未来都会产生投资机会,但不一定会是那种千亿市值的特别大的公司, ToB的应用可能会容纳一些专精特性,小而美的公司也会很多,因为它往应用 端去走。但是在数字产业化,就是提供云基础设施这一方面会有一些大公司。 现在已经有一些大公司了,无非是这些大公司能不能从千亿市值涨成更大市 值,成长空间到底有多大 5G的建设目前是不是到了中后期, 它的投资逻辑是否发生变化,未来怎么看 1 关于 5G我之前总结了两句话,第一句话是从新基建走向新应用。这个观点很明 确,就是基建的投资肯定是告一段落 2 下一步我们要思考怎么用好这么好的基础设施,就是这么好的高速公路修通了, http//research.meritco-group.com 久谦 | 服务进步的群体 | 8 我怎么保留大量的车来走 a 硬件和软件没有孰优孰劣之分,它是一个螺旋式创新,所以今年 5G的应用就 很重要。到底有没有一些好的应用,比如自动驾驶、工业互联网、 VR、 AR, 这是 5G潜在的一些比较大的场景 b 所以从新基建走向新应用,在 5G的投资上今年应用的机会应该更多。 3 第二个,在投资上要注意从终端走向云端,这个可能听起来比较绕,但很好理解 a 过去产业链的价值是承载在终端上的,比如我们买一个手机、电脑很贵,而且 我们会关注它的内存、 CPU指标。但现在我们买手机有可能关注它的屏幕大不 大、摄像头多不多,原因是什么呢 b 算力或者计算的功能是在云端的,承载在云上面的,就是英伟达做的这个工 作。因为网速足够快,我的内容没有存在本地,实际上我没有必要存本地。以 前大家丢了手机很慌张,现在丢了马上想找回账号密码,其实硬件本身变成一 个显示器,所以很好理解 c 其实你所有产业链的价值量或者算力是在云端的, 所以在 5G投资上也要注 意。以前我们投 5G可能大家会关注手机产业链,但现在你可能要关注应用, 云端有没有投资机会。再比如汽车,去年对于智能车或者电动车,我们关注硬 件本身的投资机会,但接下来的重点应该在自动驾驶和智能座舱 http//research.meritco-group.com 久谦 | 服务进步的群体 | 9 ChatGPT对国内产业的影响 2/17 ChatGPT出来之后,对我们国内相关产业的影响国内相关的厂商,阿里、百度未来 一段时间落地情况 1 从国家层面, GPT这个产品推出以后,网信办已经发出了一些政策相关的东西 a 从国家层面的角度来说,短期内我们很难看到 ChatGPT这些产品直接跟国内的 应用,或者做比较深度的结合,因为这块不管是基于信息安全,还是国内的一 些产业保护的角度来说,国内可能都得需要有这样一个窗口期,得需要有逐步 缓冲的时间 b 所以,国家后续会出台相关的政策,给国内的玩家们提供追赶的时机 2 从我们之前对百度文心类似产品的使用体验来看,内容的质量上百度文心和 CHATGPT差距不是特别大,只是在内容的多样性上有差距 a 咱们国内研究相关的大模型的,目前主要靠工程人员和研发人员,大概几百号 人或者上千号人这么研发,在这个过程中 没有引入像 OpenAI这种用户反馈机 制,没有大量的用户在技术模型的迭代过程中参与进来 b 所以在内容的多样性上会有所欠缺 3 可能跟目前实际没有放开政策有关系,就是比如像 CHATGPT响应能力,一个 Q过 去, A回来大概是 1-3秒,响应能力比较快。目前百度文心这边我们能够体验到 的,大概短的在 20 秒左右,长的甚至在 80 秒以上 4 当然这个不是技术瓶颈问题,需要在模型研发完成以后,我需要在服务器做部 署,部署完之后支持数以百万计,甚至数以千万计高并发访问的需求,这块属于 常态的部分。未来 3-6个月左右的时间,像百度文心、阿里推出类 似于 CHATGPT 的产品应该可以达到目前 CHATGPT60-70左右的水平 ChatGPT出来之后,一开始在美国程序圈特别火,比如说从应用层面,或者算力层面 有什么样对行业的影响百度或者其他有没有正在加大投入的 1 先说一下整个参与的玩家,只说国内。像百度已经宣布了,阿里达摩院也宣布了 会投入 3个亿的基金做这块。当然还有我们想不到的,比如说美团前合伙人也宣 布下海做这件事情。当然可能在其他的领域,包括您提到的字节,也对之前一些 GPT2.0、 3.0,可能以开源的模型作为基础,也做了一些相应的优化,也跟这些客 户推 相关的解决方案 2 像字节也做了一些优化。主要是训练过程,在云服务架构上,通用的算力部署, 大概会有 1.5-2.5倍的效率提升。可能跟我们接触的部门有关系,它自己没有单纯 的训练大模型,更多的想把服务包给愿意做大模型的公司 3 这个模型训练的成本主要有三个方面,单纯从基础算力投入这块大概是 384块到 3,000块左右的 A100的投入,基本上可以满足要求。这块的费用大概 400-1,000 万美金,最多到 3,000万美金的规模,所以对于很多巨头、独角兽甚至一些初创 团队,其实都有能力做这个投入。而且它的算法的基础都是基于预训练这 样一种 机制。所以参与的玩家会比我们想象的要多 4 关于技术跟行业结合的影响,短期内主要是有两个大的方向 a 一个方向就是不管是谷歌也好,还是微软也好,肯定会跟搜索引擎做结合。这 块主要是用来提升搜索引擎的信息获取的效率 b 第二个大的方向,对于微软来说更加有优势,就是把类似于 ChatGPT的这种技 术跟办公软件做结合。因为跟办公软件做结合有一个好处,它可以提高日常生 活工作的效率。比如说处理表格,或者写一写小作文,类似这种可以提高效 率。而且可以很好的在工具软件的定位上,把一些资讯的敏感性过滤掉 c 如果只是单纯的跟搜索引擎结合的话,这里面可能会有一些政策、政治、意识 http//research.meritco-group.com 久谦 | 服务进步的群体 | 10 形态,类似这方面的影响。而且从内容的提供信息给终端用户使用的角度来 说, AIGC这种方式也存在一个被大家忽略掉的风险,以百度、谷歌来举例 子,比如说传统的搜索引擎的提供商都是通过快照这种方式把信息抓取过来, 实际上用户看到的是一个个的链接 d 用户 点进去这些链接查看自己想要的信息,出了问题承担责任的话,其实是可 以通过这个链接找到一个最终的责任方。即使像之前百度跟莆田系的关系一 样,尽管可能口碑不好,但是我可以找到莆田系的医院承担最终的责任 5 但是目前以类似 CHATGPT的技术,相当于对这些信息做了二次加工,这个责任的 主体其实已经在这个过程中发生了变化。所以这时候其实如果大家没有意识到这 一点的话,可能承担责任的话,谁提供这个信息,谁提供这个产品,就变成了最 终的责任方。所以在具体的内容呈现上,可能还需要做一些优化 投入成本方面,您指的是比如说需要买算力芯片、 服务器芯片的成本,还是算法工程 师上面的投入成本 1 要做大模型的话,算法成本一共是包括三部分 a 第一,刚才已经提到的这部分,基础的算力投入,这块大概是三四百万美金到 一千万美金左右的规模,无非是我投入的少,训练的时间长一些,比如说 170 天, 200天,大概这样的 i 如果投入的多一些,像英伟达也在合作做大模型,五千亿的参数,我投入 了 3,072块 A100做训练,这块效率可以缩短到 20-30 天 ii 这个成本在整个大模型训练过程中最少的。真正的大头在数据采集、模型 的技术迭代和优化过程中。这一块需要堆集大量的研发人员、工程师、科 学 家做这方面的工作 iii 比如说数据采集,我们要抓取整个新浪、网易、搜狐、知乎这些网站的数 据,因为这些网站都有反爬虫的策略,所以需要堆集大量的人员去写破解 反抓取策略的策略,这块会耗费大量的人力和工程师的时间 b 第二,引入用户反馈机制,这时候不仅仅是研发人员了,有大量的标注人员, 有大量的用户参与,这块耗费的一个是时间长,另外一个是成本高。对于 OpenAI来说,每年在这块的投入在 1亿到 1.5亿左右美金的规模,这是比较大 的地方。因为数据采集和处理的时间会远大于单纯训练的时间 c 第三,模型正式上线了,运维和部署。像 ChatGPT一样,上线以后很快获得日 活一亿左右的庞大的用户群体,这个过程中我要处理数以十万计,甚至数以百 万计的请求。过程中需要堆集大量的服务器,需要做分布式部署,需要做负载 均衡,甚至搭载网络安全策略,防止黑客攻击 2 这个过程中还会产生大量的比如说电力的消耗,这块每年的成本至少在五千万美 金以上。所以主要由这么三大部分构成的 您说到的这几块,是不是也要分训练相关的成本,以及运营过程中的三块的成本。这 块会有什么差异吗 1 比如说前两部分,我们都可以归纳为是训练的成本 2 第三部分可以归纳为服务正式部署上线之后运营方面的成本 像国内的浪潮、海光,他们跟英伟达这块的高算力相关的芯片,或者是服务器能不能 支撑上。如果说英伟达他们的芯片不能卖给中国的话,中国有没有类似的解决方案 1 从两个方面说,单纯讲芯片和算力的研发能力这块,我们肯定跟英伟达这些公司 是有差距的。不管您提到的浪潮、华为、寒武纪,哪怕研发出来最顶级的芯片, 还是有比较大的差距,这是一块短期内应该还是比较难跟上的。即使我们在某些 技术上有优势,但是最大的问题不是在单纯的技术上,而是在整个生态体系,这 块英伟达非常完善 http//research.meritco-group.com 久谦 | 服务进步的群体 | 11 2 我们可以分 享一些数据,比如说在全球的超算中心,英伟达大概可以有 90的份 额,全球的云服务中心,那边可以有 80的份额,这个其实在短期内很难改变的 状态 3 再从国内的这些不同类别的厂商,从采购高端显卡的实际情况来看,这种限制肯 定会有影响,但是影响可能没有我们想象的这么大,可以说政策是政策,生意是 生意。比如说目前我们国内的四大巨头,像字节、阿里、百度、腾讯这四家公 司,在 CHATGPT火之前,去年的这些数据每年大概采购 A100这种级别的显卡的 数量,大致是在 2.5万片左右 4 像浪潮这些公司,英伟达那边提供了相当于稍微有点阉割的 A100,或者 H100同 级别的显卡和芯片。基本上没有特别大的影响,至少目前来看 像百度刚才您说到的一些,您觉得训练出来可能也差不多。从算法模型来说,因为 ChatGPT3.5它是闭源了。像百度、字节他们未来研发出自己的 GPT产品,从过去的 3.0开源版本找这些数据,去直接拿它的模型在上面改,还是说需要重新去搭建一个 大的模型,这个具体在算法上大概是怎么样去做 1 这块目前比如说从字节那边了解到的情况,从阿里那边了解到的情况,基本上都 是基于 GPT3.0以前,就是开源那些东西拿过来去改,这个相当于是一个基础。当 然 GPT3.0的基础也是以预训练模拟训练作为最底层的算法逻辑的。所以从这个角 度讲,你可以理解为大家在通用模型上是一套东西 2 尽管不会从 0开始的这么一种状态,但是训练的时候 OPENAI尽管细节我们没有办 法复现,但是至少方向上是明确的。比如说过程中引入用户反馈机制,用户反馈 机制说起来高大上,但是实际上就是堆人,可以简单的这么理解,针对同一个 A,我组织成百上千的人去组织或者提问不同的 Q,针对同一个 Q,组织成百上千 的人去回复不同的 A 3 这个其实就是为了满足内容生 成,就是预训练的时候我有大量的多样化丰富的数 据,才能够满足 AIGC这块基础训练的需要 4 其实目前百度文心这块欠缺的可能就是在这一点上,在内容的多样性上,丰富度 上有差异。因为之前我们不要说国内的公司了,包括国外的公司,包括谷歌这边 其实也是一样的,它的整个研发过程中,其实普通的用户很少参与,都是堆积大 量的工程师、科学家、研究人员做这个工作,在正式公测之前普通用户很少参与 5 但是 OPENAI经过前几个版本的迭代,在这个过程中发现了普通用户参与的好处, 所以才推出了用户反馈机制,大家顺着这个思路做就好了。细节上可能没有完 全 复现,但是效果上不会有太大的差距 在短期没有能够创造收益的情况下,您觉得这些互联网巨头可以持续做这个投入吗 年化下来费用大概总共是多少 1 其实对于 OPENAI推出 CHATGPT来说,在整个的领域,我们现在已经可以看到很 多的迹象,不管是前美团的合伙人王慧文总,他自筹资金,搭建团队研发模型, 还是说从目前一些招聘渠道,可能对 NLP、 AIGC相关人才的需求,我们已经可以 看到这些迹象,大家都会增加这方面的投入 2 之所以会增加这方面的投入,其实是因为 OPENAI推出 CHATGPT有点像一条鲶 鱼,大家如果不跟上这波浪潮,有可能在未来会被甩掉,这是极有可能的。所以 目前大家基于被动防御的策略,我们可以看到不管是谷歌也好,百度也好,阿里 也好,这些公司都在宣布往里面投入资金做模型 3 所以相对比较短的时间内,因为还有后续的比如说 GPT4 这些东西不断的推出,所 以在未来 2-3年的时间里,在这种类似 CHATGPT大模型的资本的输出,肯定是一 个可以预见的一个地方 如果放在中长期来看,最终的格局大概率国内就是一两个,两三个大模型最后能跑出 http//research.meritco-group.com 久谦 | 服务进步的群体 | 12 来。现在可能
点击查看更多>>

京ICP备10028102号-1
电信与信息服务业务许可证:京ICP证120154号

地址:北京市大兴区亦庄经济开发区经海三路
天通泰科技金融谷 C座 16层 邮编:102600