ChatGPT实践
从2022年11月开始,以stable diffusion为代表的AI绘画模型大行其道。到12月份,又来了chatGPT。浙大陈为老师认为,chatGPT为代表的大模型是今年以来的计算机科技圈的最大热点,可能是自2012年深度神经网络以来最重要的AI技术突破。从可视化角度讲,可以做AI模型的人机交互系统,数据工程的调优系统、AI可解释性可视化系统等,相关论文至少可以发3年。此类研究是未来可视化的重要研究方向。
我出于个人兴趣也投入了一些资源进行调研,例如11月就玩了玩AI绘画,2月1日-14日组织理工大上我的科创训练课的本科生一起使用chatGPT生成故事,再把故事用AI绘画绘制成连续的图。鉴于最近对此感兴趣的人越来越多,包括我的一些亲戚同学,所以有必要把相关的一些资料记录下来分享。
一. chatGPT的注册
魔法上网,全局模式,删除浏览器缓存,之后,参考这个地址 完整ChatGPT注册指南,如何创建一个账户 - SMS-Activate
如果你觉得虚拟短信之类的太麻烦,也可以试着注册微软新出的new bing。作为openAI的投资方,微软第一个把类chatGPT组合进了自家的搜索引擎,使用效果比chatGPT不差。
不过new bing也需要魔法上网,全局模式,删除浏览器缓存这三个步骤,而且注册完还需要排队。如果嫌麻烦,建议等上个半年一年的,估计到时候就会有很多厂家的应用可用。但是作为研究者的话,还是得自己吃螃蟹。
二. chatGPT的功能介绍
在注册账号时有四种可选,分别是普通路人用户、软件开发者、AI研究者和新闻记者。选路人用户看到的就是普通的对话功能页面。我选的是软件开发者,这个角色时用chatGPT的API开发其他NLP应用的,所以会直接进入openAI应用开发者平台。当然,如果你注册成了别的类型的用户,也可以直接访问这个网址(Overview - OpenAI API)来进入openAI应用开发者平台
其中的example页面罗列了chatGPT在NLP领域的种种功能应用,可以用来扩展思路,了解NLP大模型都能做什么。
从类别上可以看到,其功能包括:
- QA 问答,问答机器人,包括现有知识问答、代码问题回复、引导模型回复知识库以外问题
- classfication 分类,包括情感分析、根据例子进行分类等NLP典型任务
- code 编码,包括但不限于编码补全、编码纠错、代码生成、代码转换
- conversation 谈话,与问答有点类似,但前文记忆更强
- genaration 创作生成,包括但不限于语法纠错、信息提取(实体识别、关键词提取、语义注释等)、自动摘要(自动化生成标题、广告、颜色、表情、评论等)、自动格式化文档(例如生成表格、会议总结、论文大纲等)、自动创作(扩写文档、编写故事、食谱创建、故事从第一人称转第三人称等)
- translation 自动翻译,除了传统的各国语言互译之外,还有计算机语言互译(例如js转python)、代码压缩、代码解释、编写故事(本质上和代码解释是一回事)。
所以难怪很多NLP研究者惊呼以chatGPT为代表的大模型颠覆了NLP研究生态。因为chatGPT几乎可以把NLP所有分析任务都完成。以后做NLP的细分任务,可能就只有拿着大模型fineturing了。
三、chatGPT问答功能使用
回到openAI的首页,点击最下面的chatGPT进入试用页面New chat (openai.com),这个页面相当于openAI应用开发者平台中的QA问答功能。但可以通过提示词,将上文讲的NLP各种细分任务都调用出来。所以关键在于,怎么进行合适的提问。
2019年台湾国立大学有一篇论文“Automatic Color Palette Design Using Color Image and Sentiment Analysis”(基于色彩图像和情感分析的自动调色板设计),简单的说就是可以根据甲方客户模糊的提示,生成对应的调色板,该论文的效果如下:
然后我用chatGPT,做了类似的工作。提问完全口语化,全中文,返回的结果可以说是惊艳的。同时也说明,很多NLP的科研如果不找特异点的话基本上会被chatGPT为代表的工具取代。
然后我又试着问了其他很多问题。总而言之,只要你提问的够专业,其回答也会更精确。同时你也可以把前文中的一些NLP子任务带进来,例如扩展内容、内容摘要等等。
网上有很多人说应该使用英语提问才能让结果更好。但就我使用的感想来看这一点并不明显。
唯一明确的注意要点是,在晚上10点以后访问chatGPT是真的慢,真的卡。多次弹出系统访问量高和遇到未知错误的提示框。据称是因为那个时段是美国的工作时间。所以在国内用chatGPT最好在北京时间8-17点。
四、注册plus会员
openAI在2022年2月推出了其付费会员功能chatGPT plus, 一个月20美刀。花了钱你可以享受到更快的回复,体验直线上升。
但是想给openAI送钱比注册账号还复杂。送钱需要信用卡,但是国内大陆和香港地区的所有信用卡都不行。因为openAI会用过信用卡的注册地信息判断拥有者所在地,强行送钱只会让你的账号被封。所以需要整个depay虚拟信用卡才能付费。
考虑到付费复杂度和提速效率有限,我暂时没交这个钱。先用new bing和免费chatGPT撑着。如果业务对速度有要求了再说。
五. openAI的其他模型
在openAI首页,我们可以看到该公司的应用除了chatGPT,还有AI绘画模型DALL.E2、英语语音识别模型Whisper,效果都很不错。
据闻,OpenAI正在开发GPT-4,它会比以前的GPT-3更厉害,并会在2023年下半年发布。数据显示,ChatGPT推出以后,Stack Overflow单月的访问量下降了3000万(这就是所谓的降维打击吗?)。
下一篇博客会谈谈我所知道的为何国内没有诞生类似成果的原因。
哈哈哈,关于中国为何没有诞生类似的成果这个话题我和同事也探讨了很多。我们认为更多的是国内的追逐利益和认知差异,更具体点就是有能力做这个的公司更注重毛利和营收,恰恰ChatGPT的发展更像大力出奇迹,哪怕是马斯克这样的人也失去了耐心(包括Google Meta 一样也没成功)。ChatGPT 的模型训练方式基本靠反复训练和模型依据生成内容反馈持续迭代优化(这原本是中国团队最擅长的工作方法)。当一家美国的创业公司用从微软融来的钱不惜代价投入巨额算力成本,大量雇佣非洲和中东的数据工人进行信息标注、用最高效率的迭代与 Google 这样的巨头进行自研语义处理大模型的“军备竞赛”时,还是有一种很不真实的感觉——这究竟是一家旧金山公司还是一家深圳公司。
从OpenApi公益团体变成估值400亿+美刀的公司可以看出,中间只有微软在持续投入。微软也不敢内部孵化这样的项目,因为结果失败就像Google蒸发的千亿市值:技术上的失败往往会反馈在股价上。
恰巧这两天国内的复旦团队研发的Moss招来一片骂声,从中也能管中窥豹,国内的先进团体的目标到底是解决什么问题(起这个名字就是功利心极强的表现,但是技术上又不达标,挨骂是再正常不过了)。
谈话间我们聊到了微软之前的对话机器人小冰以及百度每年都在提的飞桨,在我们眼里他们更关注如何解决生产问题,是聚焦找到盈利场景而非聚焦解决某个问题,加上各大厂之间的商业角逐,信息是趋于封闭的。在我看来中国想有成功的、健全的自然语言大模型,一切可能都要从robots.txt开始,当然也需要真正有耐心、有远见vc可以一直投入。
你的回答很有水平啊。
浙大这边AI讨论班的博士认为主要还是在于AI软件工程方面有差距。一方面是国内对数据工程的投入太少(包括管理水平和从业人数),没法提供有效的alignment优化模型;另一方面国内企业AI项目负责人平均在职时间不到1年半,无法让一个项目长期持续。但从更底层的逻辑来看,还是你说的那样,因为国内企业注重利和营收所以不可能让一个不盈利的项目长期持续,自然也无法支持一个长期看起来没有回响的AI项目。而且这种项目也不能交给事业单位进行,那样更花钱听不到响。目前chatGPT是由富国的初创公司弄出来有其经济逻辑的必然性。