探索未来!揭秘OpenAI的ChatGPTPlus:打破亿级用户里程碑,开启商业新纪元?
文章主题:
(报告出品方/作者:德邦证券,马笑)
ChatGPT概述
OpenAI:人工智能研究领域最前沿的公司之一
🌟🚀OpenAI,AI研究领域的领导者,创新产品如ChatGPT、🔥DALL·E2和私密对话利器Whisper,引领潮流!💡成立于2015年12月,硅谷巨头的智慧结晶——马斯克、阿尔特曼(Y Combinator掌门人)与彼得·蒂尔(PayPal联合创始人)携手打造。🔍专注于三大研究路径:深度学习生成模型,神经图灵机算法,以及强大的深度增强学习技术。他们的探索,不断推动人工智能的进步,让科技更贴近生活!🌐
ChatGPT月度用户已破亿,正在逐步探索商业化途径
🌟🚀ChatGPT,2022年11月的聊天机器人革命!🔥💡由OpenAI引领的新一代智能模型,于11月30日震撼发布。它不仅仅能模仿人类对话,还能深度理解语境,像真正的朋友一样互动交流。📝💼无论是撰写邮件、创作剧本、文案还是代码,甚至是语言翻译,ChatGPT都能信手拈来,无所不能!✨💡据统计,仅两个月时间,月度用户量就突破亿大关,其影响力可见一斑。🔥📈UBS数据揭示,ChatGPT的崛起速度令人惊叹,2个月后用户数破亿,商业潜力无限。👀💰2023年2月1日,OpenAI迈出了商业化步伐,ChatGPT Plus付费订阅服务正式登场,美国用户只需每月支付$20,即可享受更多高级功能。💡💻准备好迎接这场技术与人性的交融盛宴吗?ChatGPT Plus正等待你的加入,一起探索无限可能!🌟🎉
ChatGPT基于GPT3.5模型进化微调,从人类反馈中学习
🌟🚀ChatGPT的背后,是OpenAI创新的智慧结晶!💡基于🔥GPT模型的深度优化,他们巧妙融合了监督与强化学习,让Chatbot更聪明、贴近人性。👨💻👩💻RLHF的独特力量,赋予它理解和执行人类价值观的能力,每一句生成都充满诚意和温度。训练过程严谨而高效:首先,GPT模型经过严格的训练和微调,解锁了语言与代码的创造魔法。📚接下来,通过精心设计的人类意图引导, Reward Model逐步形成,为内容排序提供精准指引。🏆最后,PPO算法精确调整,确保生成的内容既满足质量又贴合期望,ChatGPT就这样一步步进化成我们的知识伙伴。ChatGPT,不仅是一个工具,它是OpenAI智慧与技术的生动体现,引领着人工智能的新潮流。👩💻👨💼让我们共同期待它的更多可能!🌐SEO优化提示:ChatGPT、OpenAI、监督学习、强化学习、RLHF、PPO、人工智能、语言生成
第一步:收集数据微调GPT3.5模型
🌟改写版:通过微调GPT-3.5这款先进AI模型,我们专注于学习如何从特定prompt中生成有监督的响应策略。选用的是InstructGPT系列中的175B参数量巅峰之作,就像教科书般的智慧引擎。比如输入”你好”,它能巧妙回应”美”,每次输出都是随机且富有创意,因为网络上的语句千变万化,”你好”后面可能跟着各种问候,而模型基于概率生成,高频搭配自然更常见。👀数据采集来源多样,既有直接来自专家的标注,也有通过OpenAI API从真实用户那里获取的鲜活样本。策略制定阶段,我们精心设计提示列表,并由专业人员按要求填写预期答案,从而筛选出一个精炼且高质量的数据集,用于优化预训练语言模型。
第二步:模拟人类偏好,训练奖励模型
🏆🚀通过精心筛选和优化,我们已构建了一个庞大而独特的数据集,其中蕴含着模型生成的丰富比较信息。这一步骤旨在为新模型的训练奠定基石——奖励模型(Reward Model, RM),一个专注于提升输出质量的智能工具。👩🏫原始排序过程,由经验丰富的标注者以人类视角进行主观评估,将每个答案按照满意度从高到低排列,形成了一套新颖的标签体系。🏆RM模型的核心任务是学习和理解这些标签,它通过分析有标签数据,训练出能够区分优劣的智慧算法。💡当面对问题如”台湾最高的山是哪座?”时,RM会依据预设规则,对两个可能的答案——’玉山’ 和 ‘谁来告诉我呀’ 进行排序,确保输出与用户需求紧密相关。例如,如果用户更倾向于直接和准确的答案,那么’玉山’ 将被RM赋予更高的排名。反之,如果答案的创新性或互动性更重要,’谁来告诉我呀’ 可能会占据上位。🏆这个过程不仅保证了模型输出的质量,也为用户提供了一种基于人类偏好的排序方式,让信息更加精准和易用。🚀
第三步:使用奖励模型,基于PPO进行最优化
🌟强化学习是优化模型的强大工具,它采用尖端的近端策略优化(简称[PPO])算法来提升效率。🔍PPO在强化学习中是个关键角色,通过迭代学习策略以最大化回报或达成特定任务,实现高效与灵活性的完美平衡。🎯它的目标明确:利用RM作为奖励信号,通过微调策略和参数,让模型在每一步都能朝着高奖励前进。”PPO的独特之处在于它能够在每次迭代中最小化代价函数,同时保持策略更新的稳定性和连续性,避免剧烈变化导致的不稳定性。🛡️这种动态调整策略的过程,确保了模型在复杂环境中也能稳健运行。总的来说,强化学习与PPO相结合,就像一把精准的调校钥匙,帮助我们优化RM模型,提升性能,实现最优状态。🏆”
核心优势
优势一:公司与微软合作,提供上下游支持
微软作为OpenAI的LP投资者,为公司提供研发底层支撑及应用的大力支持。 资金支持:2019年7月22日,微软投资OpenAI 10亿美元;2023年1月23日,微软宣布与OpenAI建立长期合作伙伴关 系进入第三阶段,通过一项为期多年、数十亿美元的投资来加速AI的突破。 服务支持:1)大规模超级计算—— 微软将增加对开发和部署专用超级计算系统的投资,以加速OpenAI的研究;继续 构建 Azure 领先的 AI 基础结构。2)独家云提供商 – Azure将为研究、产品和API服务中的所有OpenAI工作提供支持。 应用支持:1月17日微软表示,计划将包括ChatGPT、DALL-E等人工智能工具整合进微软旗下的所有产品中,并将其 作为平台供其他企业使用,包括且不限于Bing搜索引擎、Microsoft Office、Azure云服务、Teams聊天程序等。
应用场景
ChatGPT以采取会员收费,未来或拓展商业模式
OpenAI的商业模式为,会员收费、开放API以及与微软的战略合作。 会员服务:2023年2月1日,OpenAI推出付费订阅项目ChatGPT Plus,价格为$20/月,目前面向美国用户。付费服务包括,在高 峰时段也可常规访问ChatGPT、更快的响应、以及优先访问新功能和改进。ChatGPT将继续提供免费访问。 API服务:ChatGPT或将加入OpenAI API,从下游用户的使用中收取费用。目前OpenAI的API以Token对于NLP的文字进行收费, 例如莎士比亚作品集需要1.2M的Token。 与微软合作:使用 Azure OpenAI 服务,采用即用即付的消费模式,以Token或托管时长进行收费。
GPT系列API可为下游应用提供语言和代码处理
ChatGPT尚未开放API,因此参考已开放API的Text-davinci-003和Code-davinci-002来解读其功能。 ChatGPT与Text-davinci-003的能力相似,均属于GPT3.5系列模型。 实现功能包括:回答问题、分类、编写代码、对话、生成、翻译和转换。
ToB:GPT系列已应用到办公应用、智能客服等
办公应用:1)AI辅助编程 :GitHub Copilot 可辅助程序员编程,通过Codex在代码编辑器中为整行或某个函数提供建议。2)市 场调研工具:Viable 使用 GPT-3 从客户反馈中提供有用的见解,可以从调查、票证、实时聊天日志、评论等中识别和提取主题 内容和情绪,并在几秒钟内提供内容总结。 智能客服:Algolia和ActiveChat 使用了 GPT-3 来更好地理解客户的问题,并将他们连接到回答他们问题的内容的特定部分。
ToC:GPT系列已应用到学习类于创作类生成
学习类:1)论文检索:GithubElicit是一个人工智能研究助手,通过检索已发表的论文,从大量研究论文中查找最相 关的摘要,并应用 GPT-3 的自定义功能来生成答案。2)语言学习:Duolingo作为一个语言学习平台,已经使用 GPT3 进行法语语法更正。Duolingo 的一项内部研究表明,使用此功能可以显著提高用户的第二语言写作技巧。
创作类:1)Blog创意生成:Blog Idea Generator通过采用搜索关键字来分析该主题在Google里最受欢迎的内容。基 于获取的数据,软件通过GPT-3生成内容来获得更高的阅读量。2)写作造句工具:Compose.ai 是一个免费的Chrome 扩展程序,可使用AI自动进行写作。只需要输入关键字词和主要内容,GPT-3可协助生成完整语句,构成全文。
ToC:GPT系列还应用于娱乐及生活类APP
娱乐类:1)AI驱动游戏:AI Dungeon是一款由AI驱动的基于文本的角色扮演游戏,AI会自动生成故事,玩家可以在 其中输入对话,人工智能将以新的事件和对话作出回应,创造独特且不可预测的游戏体验。2)AI聊天伙伴: WhatsApp 上的AI Buddy是由GPT-3.5驱动的软件,可以和用户进行对话,就像发消息给朋友一样。例如,“给我讲个 笑话”、“给我一个博客构思”等。
生活类:税务助手:Keeper Tax可帮助个人记录税务情况。在关联到个人财务账号后,Keeper Tax用不同模型提取文 本信息并分类交易类型。
应用一:ChatGPT已与搜索引擎相结合
ChatGPT已加入浏览器扩展程序,集成了ChatGPT-4的BING短暂上线 。 ChatGPT已作为扩展程序加入到Chrome、Firefox、Edge等浏览器的应用中;Bing、谷歌等搜索引擎中将接入ChatGPT, 得到自然语言回答。 集成了 ChatGPT-4 的新版 Bing 曾于2月4日短暂上线。据设计师 Owen Yin分享的截图,新版 Bing 的搜索框变为聊天 框,会在聊天气泡中回复用户的问题。新版 Bing 鼓励用户使用自然语言而不是关键字进行搜索,还能够根据用户的要 求调整搜索结果。
应用二:泛娱乐行业应用,包括游戏、直播等方面
元境科技率先接入ChatGPT,结合自研多模态智能算法,完成了行业首个AIGC互动直播功能的落地。 元境科技虚拟数字人已经接入ChatGPT等模型,并已在Tik Tok跨境电商直播、虚拟主播直播互动等场景实现应用,并 形成产品化解决方案。未来,将更加关注数字人与ChatGPT等模型的整合应用,快速扩展到不同行业、不同场景。 行业首个应用此项技术的虚拟主播是虚拟二次元网红CiCi。在最近的一大段时间里CiCi的直播早已替换为了AIGC互动 直播,在测试应用期间一众粉丝均未看出任何异样,同时在使用测试期间粉丝量也持续稳步提升。
类似产品
Claude:谷歌旗下ChatGPT有力竞品
Claude是Anthropic新推出的一款类似于ChatGPT的AI助手,谷歌已经向Anthropic投资约3亿美元。 Anthropic是由前OpenAI的一支研发团队出走成立的人工智能初创公司,大多为 OpenAI 的早期及核心员工,深度参与过OpenAI 的多项课题,比如GPT-3、神经网络里的多模态神经元、引入人类偏好的强化学习等。 根据Financial Times报道,谷歌已经向Anthropic投资约3亿美元。通过这笔交易,谷歌将获得Anthropic约10%的股份,后者要用 这笔钱从前者的云计算部门购买大量计算资源。 Claude目前还处于实验阶段,开创性引入了“宪法人工智能”(Constitutional AI,CAI)的概念。 与RLHF不同,宪法AI的过程使用模型而不是人类来生成微调输出的初始排名,根据一系列基本原则选择最佳回复,即RLAIF。
百度:拥有打造国产ChatGPT能力的公司
百度拥有飞桨(深度学习开源框架)、百度AI大底座(全栈AI基础设施)和文心大模型(AI应用场景全覆盖)。 PaddlePaddle飞桨是中国自主研发的第一个深度学习框架。深度学习框架是在完成深度学习时一套可以复用的代码,使得使用 者在开发深度学习程序时可以不用从复杂的神经网络搭建开始编代码,而是在已有的模型上进行个性化改进。 百度AI大底座:国內首个全栈自研的Al基础设施,面向企业Al开发和应用,提供端到端自主可控、自我进化的解决方案让企业可 以快捷、低成本地实现“Al能力随用随取” 。文心大模型:源于产业、服务于产业,是产业级知识增强大模型。百度通过大模型与国产深度学习框架融合发展,打造了自主创 新的AI底座,大幅降低了AI开发和应用的门槛,满足真实场景中的应用需求,真正发挥大模型驱动AI规模化应用的产业价值。
ERNIE:百度基于BERT打造的NLP模型
2月7日,百度官宣其新的大模型项目“文心一言”,英文名ERNIE Bot。 ERNIE是百度开创性提出的基于知识增强的持续学习语义理解框架。 ERNIE在情感分析、文本匹配、自然语言推理、词法分析、阅读理解、智能问答等16个公开数据集上全面显著超越世 界领先技术,在国际权威的通用语言理解评估基准GLUE上,得分首次突破90分,获得全球第一。 ERNIE在工业界得到了大规模应用,如搜索引擎、新闻推荐、广告系统、语音交互、智能客服等。
ERNIE由BERT进化而来,经过一系列的升级,目前已推出3.0版本。 在 ERNIE 3.0 中,自回归和自编码网络被创新型地融合在一起进行预训练。 自编码网络采用 ERNIE 2.0 的多任务学习增量式构建预训练任务,持续的进行语义理解学习。 通过新增的实体预测、 句子因果关系判断、文章句子结构重建等语义任务进行预训练;同时,创新性地增加了知识增强的预训练任务。 自回归网络基于 Tranformer-XL 结构,支持长文本语言模型建模。多范式的统一预训练模式使得 ERNIE 3.0 能够在理 解任务、生成任务和零样本学习任务上获取 SOTA 的表现。
报告节选:













(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源:【未来智库】。

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!