ChatGPT实践

从2022年11月开始,以stable diffusion为代表的AI绘画模型大行其道。到12月份,又来了chatGPT。浙大陈为老师认为,chatGPT为代表的大模型是今年以来的计算机科技圈的最大热点,可能是自2012年深度神经网络以来最重要的AI技术突破。从可视化角度讲,可以做AI模型的人机交互系统,数据工程的调优系统、AI可解释性可视化系统等,相关论文至少可以发3年。此类研究是未来可视化的重要研究方向。

我出于个人兴趣也投入了一些资源进行调研,例如11月就玩了玩AI绘画,2月1日-14日组织理工大上我的科创训练课的本科生一起使用chatGPT生成故事,再把故事用AI绘画绘制成连续的图。鉴于最近对此感兴趣的人越来越多,包括我的一些亲戚同学,所以有必要把相关的一些资料记录下来分享。


一. chatGPT的注册

魔法上网,全局模式,删除浏览器缓存,之后,参考这个地址 完整ChatGPT注册指南,如何创建一个账户 - SMS-Activate

如果你觉得虚拟短信之类的太麻烦,也可以试着注册微软新出的new bing。作为openAI的投资方,微软第一个把类chatGPT组合进了自家的搜索引擎,使用效果比chatGPT不差。

不过new bing也需要魔法上网,全局模式,删除浏览器缓存这三个步骤,而且注册完还需要排队。如果嫌麻烦,建议等上个半年一年的,估计到时候就会有很多厂家的应用可用。但是作为研究者的话,还是得自己吃螃蟹。

二. chatGPT的功能介绍

在注册账号时有四种可选,分别是普通路人用户、软件开发者、AI研究者和新闻记者。选路人用户看到的就是普通的对话功能页面。我选的是软件开发者,这个角色时用chatGPT的API开发其他NLP应用的,所以会直接进入openAI应用开发者平台。当然,如果你注册成了别的类型的用户,也可以直接访问这个网址(Overview - OpenAI API)来进入openAI应用开发者平台

https://platform.openai.com/

其中的example页面罗列了chatGPT在NLP领域的种种功能应用,可以用来扩展思路,了解NLP大模型都能做什么。

https://platform.openai.com/examples

从类别上可以看到,其功能包括:

  1. QA 问答,问答机器人,包括现有知识问答、代码问题回复、引导模型回复知识库以外问题
  2. classfication 分类,包括情感分析、根据例子进行分类等NLP典型任务
  3. code 编码,包括但不限于编码补全、编码纠错、代码生成、代码转换
  4. conversation 谈话,与问答有点类似,但前文记忆更强
  5. genaration 创作生成,包括但不限于语法纠错、信息提取(实体识别、关键词提取、语义注释等)、自动摘要(自动化生成标题、广告、颜色、表情、评论等)、自动格式化文档(例如生成表格、会议总结、论文大纲等)、自动创作(扩写文档、编写故事、食谱创建、故事从第一人称转第三人称等)
  6. translation 自动翻译,除了传统的各国语言互译之外,还有计算机语言互译(例如js转python)、代码压缩、代码解释、编写故事(本质上和代码解释是一回事)。

所以难怪很多NLP研究者惊呼以chatGPT为代表的大模型颠覆了NLP研究生态。因为chatGPT几乎可以把NLP所有分析任务都完成。以后做NLP的细分任务,可能就只有拿着大模型fineturing了。

以上每个例子都可以到playground种试用,大部分情况下效果都不错。例如此图就是Summarize for a 2nd grader(将复杂文本简化为二年级学生也能看懂的自动摘要应用)

三、chatGPT问答功能使用

回到openAI的首页,点击最下面的chatGPT进入试用页面New chat (openai.com),这个页面相当于openAI应用开发者平台中的QA问答功能。但可以通过提示词,将上文讲的NLP各种细分任务都调用出来。所以关键在于,怎么进行合适的提问。

2019年台湾国立大学有一篇论文“Automatic Color Palette Design Using Color Image and Sentiment Analysis”(基于色彩图像和情感分析的自动调色板设计),简单的说就是可以根据甲方客户模糊的提示,生成对应的调色板,该论文的效果如下:

然后我用chatGPT,做了类似的工作。提问完全口语化,全中文,返回的结果可以说是惊艳的。同时也说明,很多NLP的科研如果不找特异点的话基本上会被chatGPT为代表的工具取代。

然后我又试着问了其他很多问题。总而言之,只要你提问的够专业,其回答也会更精确。同时你也可以把前文中的一些NLP子任务带进来,例如扩展内容、内容摘要等等。

网上有很多人说应该使用英语提问才能让结果更好。但就我使用的感想来看这一点并不明显。

唯一明确的注意要点是,在晚上10点以后访问chatGPT是真的慢,真的卡。多次弹出系统访问量高和遇到未知错误的提示框。据称是因为那个时段是美国的工作时间。所以在国内用chatGPT最好在北京时间8-17点。

四、注册plus会员

openAI在2022年2月推出了其付费会员功能chatGPT plus, 一个月20美刀。花了钱你可以享受到更快的回复,体验直线上升。

但是想给openAI送钱比注册账号还复杂。送钱需要信用卡,但是国内大陆和香港地区的所有信用卡都不行。因为openAI会用过信用卡的注册地信息判断拥有者所在地,强行送钱只会让你的账号被封。所以需要整个depay虚拟信用卡才能付费。

考虑到付费复杂度和提速效率有限,我暂时没交这个钱。先用new bing和免费chatGPT撑着。如果业务对速度有要求了再说。

五. openAI的其他模型

在openAI首页,我们可以看到该公司的应用除了chatGPT,还有AI绘画模型DALL.E2、英语语音识别模型Whisper,效果都很不错。

据闻,OpenAI正在开发GPT-4,它会比以前的GPT-3更厉害,并会在2023年下半年发布。数据显示,ChatGPT推出以后,Stack Overflow单月的访问量下降了3000万(这就是所谓的降维打击吗?)。

下一篇博客会谈谈我所知道的为何国内没有诞生类似成果的原因。