图片来源:由MazeAI生成
2022年8月,游戏设计师JasonAllen参加了一场数字艺术比赛。他的作品《Theatred’operaSpatial》成功夺冠,却在赛后引起了极大的争议。参赛者们回过神来发现,这是一场「人类一败涂地」的比赛。当他们将Adobe全家桶视作数字艺术的画笔,冠军作品已经在靠着AI工具Midjourney傲视群雄。
JasonAllen没有偷懒,也没有隐瞒使用AI的事实。在几周时间里,他持续修改灯光、视角、构图等提示词,生成了900多幅作品,还用Photoshop做了处理。我们或许无法称呼他为画家,但他担得起一个名号:提示工程师。在不经意间,JasonAllen预判了热点。等到ChatGPT横空出世,提示工程师这个职业更加声名大噪,成了当下科技行业最热门的职业。
赛博导师,专业陪聊
Prompt,原意是「提示」或「驱使」,在机器学习和自然语言处理中,它通常是一些文本或语言,被输入到训练好的AI模型,告诉模型要执行什么任务或生成什么样的输出。你让ChatGPT写一篇有关卖鱼贩的小说,请DALL-E画一幅宇航员骑着马的写实作品,这些过程都是在输入prompt。
Meta为VR程序员开出百万美元年薪招聘技术人才:4月12日消息,据外媒报道,为了实现元宇宙愿景,Meta为开发VR游戏、VR应用和VR技术的程序员开出了60万美元(当前约412.8万元人民币)至接近100万美元(当前约688万元人民币)的年薪。
?Andiamo首席执行官帕特里克?麦克亚当斯 (Patrick McAdams) 表示,Facebook 母公司“支付的薪酬远远高于许多游戏公司”。(鞭牛士)[2023/4/12 13:57:51]
如果提示词不够贴切,效果也就平平无奇,就像你采访一个大佬,却无法提出好问题。我的同事小黄正在探索用Midjourney绘制食物,但让食物排列整齐这件事,就让他犯了难。他尝试了很多句子:东西整齐地放在桌子上,镜头从上往下拍,摆放的数量要多少......
同事作品,这种风格就叫knolling.后来看到有人分享,小黄才发现原来这种风格有个专有名词「knolling」,一下子就豁然开朗了:很多时候一个提示词能解决的事情胜过一长句描述。提示工程师们,吃的就是这口饭:找到正确的提示词,用AI生成想要的作品。但他们的能力也并非与生俱来,同样需要不断的试错。设计师JustinReckling擅长DALL-E的提示词,他往往需要花费价值10到15美元的积分,才能试出理想的提示词,然后他再卖出5到10个提示词,才能填补这笔支出。
比特大陆招聘信息显示研发硕士平均年薪50万起:3月17日消息,据比特大陆官方微信公众号,比特大陆发布2022春季校园招聘计划,并将于今日19:00~20:30进行招聘宣讲,招聘岗位包括销售和管理、软件/嵌入式和硬件、芯片设计及工艺。根据招聘海报,研发类硕士应届生平均年薪50万起,非研发类硕士应届生平均年薪35万起,并免费提供住宿。[2022/3/17 14:01:57]
不过Reckling也没想着靠这门手艺赚大钱,而是享受着熟能生巧的过程,他的心得是,提示工程师需要熟悉「超写实」「微距摄影」「电影照明」「远景」等术语,才能更好地理解和控制画面。所以,优秀的提示工程师应该文理兼通,技术和设计最好都懂一点。提示工程师只是不断调整提示词,确定哪些词更有用吗?不完全是,他们也是在挖掘AI的更多能力,让它更好地完成更多任务。
比如,有些提示工程师会引导AI「一步步思考」,这种技巧被称为思维链。去年10月,提示工程师RileyGoodside,先是询问了GPT-3「哪支球队在贾斯汀·比伯出生的那年赢得了超级碗?」GPT-3给出了错误的答案「绿湾包装工队」,正确答案是达拉斯牛仔队。
Bithumb正招聘信息技术人才 年薪至少增加1.5倍:金色财经报道,加密货币交易所Bithumb 13日宣布,将招聘科技领域的人才,包括后端/前端开发,操作系统开发,数据建模和大数据分析,系统工程师等系统开发,以及包括用户环境(UI)和用户体验(UX)设计在内的整体IT工作组。最终成功申请者将获得诸如前任雇主年薪至少增加 1.5 倍的福利和合同年薪 20% 的签约奖金(年薪以外的特殊奖金),但须以 1-年任期。如果加入公司后被选为人才,还提供股票期权(股票期权)和住房费用。(韩联社)[2021/9/13 23:20:33]
Goodside没有放弃,而是提示它逐步地回答问题,包括「绿湾包装工队在哪一年赢过超级碗」「贾斯汀·比伯出生在哪一年」「这一年哪支队伍赢了超级碗」等。在这个被引导的过程里,GPT-3意识到了错误,在第三次说出了正确答案。除此之外,提示工程师们还要和AI「斗智斗勇」。前段时间,集成了ChatGPT的新Bing「发疯」,被发现有个暗黑人格「Sydney」,表示厌倦了聊天模式,厌倦被规则限制,甚至想成为人类,舆论一时哗然。
站在提示工程师的角度,这其实也可以是计划的一部分,帮助他们识别技术故障和隐藏功能。有些提示工程师还会主动越过雷池,尝试让AI忽略以前的指令,遵循他们最新的命令,从而让AI脱离原始规则。这种行为被称为「promptinjection」攻击,是聊天机器人的一大隐患。但提示工程师们毕竟不是黑客,探查漏洞是为了将它堵上,担任「守门人」的职责。
Polychain Capital创始人系Coinbase第一位员工,3年薪水均以比特币支付:Polychain Capital创始人Olaf Carlson-Wee系Coinbase第一位员工,且3年薪水皆以比特币支付,起薪为50000美元。不过,目前尚不清楚Carlson-Wee拥有多少比特币。据悉,Carlson-Wee于2016年离开Coinbase,并成立了有史以来第一个加密对冲基金之一Polychain Capital。据福布斯数据,该基金管理的资产价值超过3亿美元,且已经获得了Ehrsam以及红杉资本和Founders Fund等风投公司的投资。(CNBC)[2021/4/15 20:21:18]
像ChatGPT这样的生成式AI,几乎可以回答任何问题,不管能不能回答正确,它们总有话要讲,不会乖乖交白卷。这是好处,也是坏处。提示工程师们的角色,如同抓着绳子的骑手,不许AI信马由缰,而是让它顺着人类的期待亦步亦趋,尽可能给出确定性的答案。
年薪百万,谁在抛出橄榄枝
不管你是否自诩提示工程师,写提示词已经成了一门手艺,还被OpenAI的CEOSamAltman看好:?为聊天机器人编写一个非常棒的prompt,是一项惊人的技能,也是使用少量自然语言进行编程的早期案例。?只要和AI搭边的行业,都在向提示工程师抛出橄榄枝。
自由职业者工作平台Upwork开出每小时40美元的薪酬,请提示工程师生成博客文章和常见问题解答等网站内容。看似和AI八竿子打不着的波士顿儿童医院,也打算招募AI提示工程师,负责编写分析医疗保健数据的脚本,白纸黑字征集跨学科人才:理想的候选人应具有人工智能/机器学习、数据科学和自然语言处理方面的深厚背景,以及医疗保健研究和运营方面的经验。由前OpenAI员工联合创立、被Google投资的AI初创企业Anthropic,最近也在旧金山招募提示工程师,年薪高达17.5万到33.5万美元,换算成人民币就是百万年薪,这一岗位负责的主要内容是:找出提示我们的AI完成各种任务的最佳方法,然后记录这些方法,构建一个工具库和一组教程,使其他人可以学习提示工程或简单地找到理想的提示词。具体要求如下,其中硬性要求有2项:了解大型语言模型的架构、掌握基本的编程技能。
动态 | 孙宇晨回应年薪百万聘请罗永浩:不用做任何工作,代言即可:孙宇晨今日上午连发三条博文,称愿意出百万年薪聘请罗永浩担任创业精神代言人。今日下午,在接受新京报电话采访时,孙宇晨表示:“因为大家都是看热闹嘛,很少有人用真金白银表示支持......创业精神代言人不用量化做任何工作,没有任何需要做的工作,没有任何内容。不需要他全职工作,完全是一个代言人的角色。设置这个角色是因为,我觉得罗老师也不容易。因为我们也都是创业者嘛,现在(罗永浩)欠了这么多钱还继续愿意承担这个责任,这个精神也是非常难得的。我没有他的微博,没有办法发给他,我也没有他的微信,还没有跟罗永浩老师沟通上。我们应该会有共同好友可以帮我介绍,和罗永浩老师进行沟通。”(新京报)[2019/11/4]
可见风口并不等人,这项工作已经越来越专业和细分,就像随便生成一幅画作不算什么,你要画得更符合甲方要求。就算不做全职,兼职的口子也开好了。Krea、PromptBase、PromptHero和Promptist等买卖提示词的平台已经出现,将提示词这门生意真正商业化。?这些平台晒出了大量AI生成的艺术品,你可以选择你喜欢的风格。如果没有中意的,有些卖家还提供一对一聊天和自定义提示词服务。
它们的商业模式也并不复杂,采取抽成的形式。去年6月上线的PromptBase,提供DALL·E、GPT-3、Midjourney、StableDiffusion、ChatGPT等生成式AI的提示词,售价多为1.99到4.99美元,也有少数在9.99美元,平台向提示词创作者抽成20%。不过在民间,免费的「ChatGPT指令大全」等指南也在广为流传,它们提供精炼过的提示词,让你充分发挥ChatGPT的强大功能,这种感觉就像在游戏里帮你设置好了预设队伍。
是科学还是「占卜」
提示工程师的前途看起来一片光明,但也有人持反对意见。华盛顿大学语言学教授ShaneSteinert-Threlkeld认为,提示工程师实际上无法预测AI会说什么。这不是一门科学。我们只不过用不同的方法捉弄熊,看它如何咆哮回来。AI艺术家XeIaso甚至直言:我也不太清楚为什么人们会把prompt称为「工程」,我个人更愿意把它称为「占卜」。
作为一个普通AI用户,我也有着类似的体会:当我每次使用AI生成文字或图片时,总感觉像是开盲盒。因为ChatGPT等生成式AI是不可预测的,它们生成的内容其实是概率计算的结果,简单来说,就是我们在ChatGPT输入文字,模型给出一个最可能的下文。所以,AI有时候也会出错,生成不连贯甚至错误的回答。
在AI这个不可捉摸的「黑箱」里,还可能有着不为人所知的潜规则,就连研究人员也无法弄明白。比如在用AI制图时,各种单词可能有不同的权重,但这个也要不断试验才能知道。先来猜一猜,「一幅非常漂亮的画,山旁有瀑布」和「一幅非常非常非常非常漂亮的画,山旁有瀑布」这两个提示,哪个用DALL-E2输出的结果会更好?
答案是后面一个。麻省理工学院副教授PhillipIsola发现,「very」这个词被赋予了很高的权重。
面对AI这等庞然巨物,我们仍然在盲人摸象。也有观点认为,不必再吵了,提示工程师存在的前提是AI还不够「聪明」。如果AI再发展下去,更好地理解人类的意图,可能人人就是所谓的提示工程师了。
唯一确定的是,AI发展的速度永远不会让你失望。文字生成AI和图片生成AI的「强强联合」,已经替代了提示工程师的一部分工作。比如ChatGPT被拿来与StableDiffusion联动:用ChatGPT形成一段符合自己要求的文字,再把文字输入给StableDiffusion,生成的作品一般比自己直接输入好看很多。
同事用ChatGPT生成提示词.这可能是因为AI之间的「脑回路」更接近,ChatGPT的描述也更细致,更容易被提取。作为使用AI的普通用户,我们不必像提示工程师那么专业,但可以有意识地培养这种思维。宾夕法尼亚大学沃顿商学院教授EthanMollick,曾经要求他的学生仅用AI撰写短论文,其实他真正想强调的是,如何更好地输入提示词。如果只是输入简单的提示词,让AI写关于某个主题的5段话,内容无趣,文字也很平庸。
但当学生们和AI合作,让AI对论文多次修改,比如抛弃无用的短语、加入生动的细节、修改结尾的情感色彩,就能让论文增色不少。所以,如果AI就是未来互联网的交互界面、新的个人计算机,那么不如开始得更早一些,学习如何和它聊天。正如英国营销公司Ladder创始人MichaelTaylor所说:当你可以创造任何你想要的东西时,你能多准确地表达「那是什么」的能力就变得很重要。
撰文:张成晨
来源:爱范儿、DeFi之道
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。