TMT观察网_独特视角观察TMT行业

上手ChatGPT威力加強版后,我發(fā)現(xiàn)它很強,但也有點拉。。。互聯(lián)網(wǎng)+

差評 2023-03-16 12:41
分享到:
導(dǎo)讀

OpenAI 發(fā)布了最新的 GPT-4。

OpenAI 發(fā)布了最新的 GPT-4。 今天凌晨,OpenAI 發(fā)布了最新的 GPT-4。  根據(jù)發(fā)布會披露的內(nèi)容來看,這個新一代比早先大家使用的 ChatGPT 的 GPT-3.5 內(nèi)核 強悍了一大截,再次刷新了編輯部對 AI 的認知。  首先,非常非常重要的一點是, GPT-4 可以接受文字以外的內(nèi)容輸入了,目前支持文字與圖像的混合輸入。 在官方的示例中,用戶給 GPT-4 上傳了一張梗圖,問 GPT-4 這張圖為什么好笑: GPT-4 非常詳細且精準地描述出了圖片上的內(nèi)容。 并且有思維條理的解釋了,為什么這張圖會讓人覺得好笑。 這還不算完,就算是十分抽象的 Meme,它也能一本正經(jīng)地給你解釋笑點在哪里。  只不過么,GPT4 也還沒到能通過圖靈的程度。 當然,這個功能并不只是能解釋梗圖那么簡單,它擁有無限的想象空間,比如: 在今天凌晨的官方直播視頻中,GTP 的開發(fā)人員演示了 GPT-4 可以識別他手繪的一張網(wǎng)頁草圖,并且根據(jù)草圖寫出網(wǎng)頁的前端代碼。 手繪的網(wǎng)頁草圖,非常抽象 GPT-4 給出的網(wǎng)頁以及代碼  雖然這個示例里的網(wǎng)站非常簡單,但 GPT-4 的理解能力和創(chuàng)造力還是讓人覺得不可思議: 重要的不是它能不能做得很好,而是它能做到,這是一個質(zhì)的飛躍。  甚至,目前已經(jīng)有公司在搞這項技術(shù)的落地應(yīng)用,打算把它和導(dǎo)盲服務(wù)結(jié)合起來。 這樣一來,盲人只需要拍張照,GPT-4 就能立即復(fù)述出面前物品的信息。 而在文字問答方面,GPT-4 也有非常大的提升,輸入字增加到了 2.5 萬。 在專業(yè)領(lǐng)域上的回答, 特別是 “ 問題復(fù)雜度足夠高的時候……GPT-4 比老版本更細、更可信、更富有創(chuàng)造力 ”。 比如,在統(tǒng)一律師考試( Uniform Bar Exam )中,GPT-4 可以超過 90% 的人類考生,而老版本只能超過 10% 的人類考生,妥妥學渣學霸的區(qū)別。 在 GRE 數(shù)學和語文 ( 閱讀與填空 )考試中 ,GPT-4 的考試成績 已經(jīng)是哈佛、麻省理工、斯坦福大學生的水平了。 不僅自己回答問題能力變強了,GPT-4 還會人格扮演。 比如你提出一個問題,ChatGPT 只會機械式地回答,而 GPT-4 可以按你的要求 以蘇格拉底風格給你作答。 那這個玩法就多了呀。  向下滑動 不過,說了這么多,百聞不如一試。 即使已經(jīng)是凌晨 2 點,編輯部依舊花重金( 20 美元/月 ),連夜讓美國同事幫忙升級試用了一波。 遺憾的是,OpenAI 考慮到用戶們搞幺蛾子的能力太狠,所以目前 GPT-4 的 圖片輸入功能暫時不對公眾開放,也沒有說啥時候可以用上。 不過,我們還是可以試試它聰明的小腦瓜子。 先是給了一個全網(wǎng)瘋傳的“ 華為、阿里入職面試題 ”,挑戰(zhàn)大獲成功。  而隔壁的 ChatGPT 就有點拉了。 作為擊敗了 90% 人類的大律師,GPT-4 的推理能力應(yīng)該強無敵吧。 所以我們又搞了道法考的經(jīng)典案件,想掂量掂量 GPT-4 到底有幾斤幾兩。  問:乙去甲家吃飯,結(jié)果電動車被偷了。于是乙準備偷輛別人的電動車,此時,喝醉的甲來幫忙撬鎖,幫乙成功得手。結(jié)果調(diào)查后發(fā)現(xiàn),乙偷的是甲的電動車,問甲算不算是盜竊罪? 雖然新舊兩款結(jié)論都是正確的,但是舊版的解題過程,就有點亂來了。。 而在一些 更需要 “ 創(chuàng)造性 ” 或是 “ 思考 ” 的問題,比如:  關(guān)于最近一次特斯拉投資者大會上 “ 實現(xiàn)全球可持續(xù)能源 ” 的計劃,你覺得是可行的嗎?為什么可行? GPT-4 的表現(xiàn)就更讓人吃驚了。 雖然 GPT-4 的知識庫停留在 2021 年 9月,并沒有覆蓋半個月前的那場投資者大會, 但它卻神奇地未卜先知了。 而老版本 ChatGPT 的回答就遜色了很多,沒有條理,還有一堆車轱轆話,沒有建設(shè)性觀點。  隨后,我們又問了一個行業(yè)思考相關(guān)的問題: 你如何看待全球的碳排放戰(zhàn)略,它能成功嗎? 老版只能浮于表面籠統(tǒng)地給點泛泛的概念,而 GPT-4 的回答明顯 維度更寬、思考更深,洋洋灑灑列了 10 點,更加細致有條理,并且含有更多專業(yè)詞匯與內(nèi)容,可以說幾乎完美地回答了這個問題。  上面這些,還僅僅只是我們編輯部的試驗,在一些大佬們手上,GPT-4 令人恐懼的表現(xiàn)就更多了。 比如僅僅只用了 60 秒,就做出了一款 Pong 游戲,20 秒就能做出貪吃蛇游戲。  不可否認,GPT-4 比起舊版來說,強的不是一點半點。不過我們試出來的問題,其實也不少。 我們搞了套 高中數(shù)學競賽試卷來考它,結(jié)果,一試就尷尬了。。 第一道選擇題,新舊兩個版本就都解錯了。  難道說,斯坦福、麻省理工還不如。。?  因為 GPT-4 可以支持更長的輸入文本,所以我們就又測試了它的總結(jié)概括能力。 這下餡露得更大了。 我們甩給它的是,差評君之前發(fā)過的一篇文章的鏈接,其實 GPT-4 是沒有聯(lián)網(wǎng)的,正常來說是沒法總結(jié)的。 結(jié)果,它愣是 憑空捏造了兩個文章總結(jié),而且和我們給的文章沒有任何關(guān)系。  直到在我反復(fù)指正兩次,語氣都加重了,它才承認自己的錯誤。 直到后面我們把原文直接貼進去后,GPT-4 才展露了它超強的總結(jié)能力。 說實話,這個胡編亂造的能力讓我們心里一驚,于是就又想了個測試方法。 前兩天,小黑胖把“ 手拿把攥 ”記混成“ 手拿把蒜 ”,被編輯部嘲笑了很久,于是我們就問 GPT-4 “ 手拿把蒜什么意思?” 結(jié)果牛掰了,GPT-4 在理解了一部分“ 把蒜(攥)”是形容事情輕而易舉的基礎(chǔ)上,引經(jīng)據(jù)典地胡編亂造,頗有種當年我寫作文時,引用的俄羅斯文學家“ 沃茲基索德 ”的味道了。 要知道,如果是真實場,這個半真半假、引用權(quán)威的胡說八道的后果將是非常嚴重的,堪稱最高級的謊言。 明明連更老的 ChatGPT 也不敢這么捏造來源地胡說,更高級的 GPT-4 怎么會這樣呢? 我們猜測,就是因為 新版本更傾向于表現(xiàn)出 “ 更具有深度思考 ”,這么一來,在回答很多問題的時候,GPT-4 會自己給自己加戲,才會出現(xiàn)這些鬧劇  雖然我們試了這么多漏洞,但總的來講,這次發(fā)布的 ChatGPT,無論是基礎(chǔ)功能、想象空間、邏輯能力、思考能力,都比之前強了一大截。  明明距離老版本 ChatGPT 顛覆我們的認知才沒幾個月,它們就又掏出了一個船新版本,我們只能說: 恐怖如斯。 更恐怖的是,其實 GPT-4 誕生時間,可能比我們想的還要早很多,之前 OpenAI 發(fā)布基于 GPT-3.5 的 ChatGPT 時,內(nèi)部員工就質(zhì)疑過為啥發(fā)個這么古早的版本。 而我們也早就接觸過 GPT-4 了,New Bing 官方今天發(fā)了個公告,承認了 New Bing 其實就是 GPT-4。 所以這么說的話,有沒有種可能,GPT-5 也已經(jīng)近了呢? 我已經(jīng)開始期待除了文字、圖片以外,視頻、音頻等形式的輸入了。 撰文: 大餅 & 小陳 & 四大 & 八戒編輯:面線 & 江江封面:萱萱 圖片、資料來源: OpenAI、New Bing 官網(wǎng)、Twitter、Be My Eyes New York Times:How ChatGPT Kicked Off an A.I. Arms Race 如果您覺得本文寫的還不錯 歡迎關(guān)注差評孵化的商業(yè)財經(jīng)類賬號:知危( ID:BusinessAlert )
GPT- ChatGPT 能力 問題 回答
分享到:

1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控熑危?br> 3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。


主站蜘蛛池模板: 门禁卡_智能IC卡_滴胶卡制作_硅胶腕带-卡立方rfid定制厂家 | 广东燎了网络科技有限公司官网-网站建设-珠海网络推广-高端营销型外贸网站建设-珠海专业h5建站公司「了了网」 | 工业胀紧套_万向节联轴器_链条-规格齐全-型号选购-非标订做-厂家批发价格-上海乙谛精密机械有限公司 | 环讯传媒,永康网络公司,永康网站建设,永康小程序开发制作,永康网站制作,武义网页设计,金华地区网站SEO优化推广 - 永康市环讯电子商务有限公司 | 玖容气动液压设备有限公司-气液增压缸_压力机_增压机_铆接机_增压器 | 威廉希尔WilliamHill·足球(中国)体育官方网站 | 二次元影像仪|二次元测量仪|拉力机|全自动影像测量仪厂家_苏州牧象仪器 | 慢回弹测试仪-落球回弹测试仪-北京冠测精电仪器设备有限公司 | 健康管理师报考条件,考试时间,报名入口—首页 | 杭州月嫂技术培训服务公司-催乳师培训中心报名费用-产后康复师培训机构-杭州优贝姆健康管理有限公司 | 不锈钢列管式冷凝器,换热器厂家-无锡飞尔诺环境工程有限公司 | 首页|专注深圳注册公司,代理记账报税,注册商标代理,工商变更,企业400电话等企业一站式服务-慧用心 | 青岛侦探_青岛侦探事务所_青岛劝退小三_青岛婚外情取证-青岛王军侦探事务所 | 进口便携式天平,外校_十万分之一分析天平,奥豪斯工业台秤,V2000防水秤-重庆珂偌德科技有限公司(www.crdkj.com) | 渣土车电机,太阳能跟踪器电机,蜗轮蜗杆减速电机厂家-淄博传强电机 | 旋振筛|圆形摇摆筛|直线振动筛|滚筒筛|压榨机|河南天众机械设备有限公司 | 玖容气动液压设备有限公司-气液增压缸_压力机_增压机_铆接机_增压器 | KBX-220倾斜开关|KBW-220P/L跑偏开关|拉绳开关|DHJY-I隔爆打滑开关|溜槽堵塞开关|欠速开关|声光报警器-山东卓信有限公司 | 学习虾-免费的学习资料下载平台| 道达尔润滑油-食品级润滑油-道达尔导热油-合成导热油,深圳道达尔代理商合-深圳浩方正大官网 | 不锈钢/气体/液体玻璃转子流量计(防腐,选型,规格)-常州天晟热工仪表有限公司【官网】 | 工业冷却塔维修厂家_方形不锈钢工业凉水塔维修改造方案-广东康明节能空调有限公司 | Jaeaiot捷易科技-英伟达AI显卡模组/GPU整机服务器供应商 | 污水处理设备-海普欧环保集团有限公司| 北钻固控设备|石油钻采设备-石油固控设备厂家 | 钢托盘,钢制托盘,立库钢托盘,金属托盘制造商_南京飞天金属制品实业有限公司 | 中央空调维修、中央空调保养、螺杆压缩机维修-苏州东菱空调 | 色谱柱-淋洗液罐-巴罗克试剂槽-巴氏吸管-5ml样品瓶-SBS液氮冻存管-上海希言科学仪器有限公司 | 恒温恒湿试验箱_高低温试验箱_恒温恒湿箱-东莞市高天试验设备有限公司 | 青岛球场围网,青岛车间隔离网,青岛机器人围栏,青岛水源地围网,青岛围网,青岛隔离栅-青岛晟腾金属制品有限公司 | 杭州月嫂技术培训服务公司-催乳师培训中心报名费用-产后康复师培训机构-杭州优贝姆健康管理有限公司 | 济南侦探调查-济南调查取证-山东私家侦探-山东白豹调查咨询公司 密集架|电动密集架|移动密集架|黑龙江档案密集架-大量现货厂家销售 | 自动检重秤-动态称重机-重量分选秤-苏州金钻称重设备系统开发有限公司 | 恒温水槽与水浴锅-上海熙浩实业有限公司 | 自动气象站_气象站监测设备_全自动气象站设备_雨量监测站-山东风途物联网 | 杭州双螺杆挤出机-百科| 刮板输送机,粉尘加湿搅拌机,螺旋输送机,布袋除尘器 | 电池高低温试验箱-气态冲击箱-双层电池防爆箱|简户百科 | 生鲜配送系统-蔬菜食材配送管理系统-连锁餐饮订货配送软件-挪挪生鲜供应链管理软件 | 铝板冲孔网,不锈钢冲孔网,圆孔冲孔网板,鳄鱼嘴-鱼眼防滑板,盾构走道板-江拓数控冲孔网厂-河北江拓丝网有限公司 | 车辆定位管理系统_汽车GPS系统_车载北斗系统 - 朗致物联 |