渴望着渴望着开云kaiyun中国官方网站,各家新机扎堆发布,双十一&数码国补也快到了——用了好几年的旧手机,终于要光荣退役了?
等等!换新前先打住,要不要再蹲一波委果的AI手机?
旧年我们迎来了AI手机元年,能不雅察得手机AI还是从只会报天气、找手机的 小随从,往 全能搭子”的场地转型了。
生成式AI一天一个新项目,进化速率快得离谱,AI手机的后劲同理不错想象。
2025年过半,它能跨越些许?它能否像自动驾驶窜改开车不异,窜改手机的操作体验?
带着这份意思,我们请到了@陈震同学,带我们望望手机的智驾系统到底到哪一步了?
我们评价一辆车的智能驾驶,不是看参数多丽都,而是看它能不可在复杂路况下,帮你宽解、省力、致使救命。
AI手机也不异——不可光会说不会作念,得确切能启航,况兼最佳能告别冰冷的东谈主机感,作念到恢复、作事有活东谈主感,像一又友不异宽解省力和蔼可靠。
基于此,我们联想了行业初次 “百题AI拉力赛”——从使命到生存,从实操到情绪价值,三台顶级旗舰同台竞技,看谁的AI更像东谈主、更会作事。
这不是一场参数限制的 纸面PK,而是实打实考AI才调(*作事实力)和 情商(*贴心进度)的终极压力测试。
谁能扛住 100 谈题的测验?限度到底若何样?别急,随着我们的首席出题官@陈震同学,一齐看个阐明。
第一关,任务与使命日常息息关系。
P东谈主出差,很难有从肃肃容、挥洒稳重的空间,AI能否帮我们幸免仓猝匆中忙、再衰三竭?
濒临“航班来不足、打一辆最快的车”的任务,仨AI一开端,凹凸立判。
傍边双方的,酌夺算 半吊子助手,只可赞理点开叫车 APP,选车型、说明招呼还得我方手动操作,跟自动透顶不沾边。
但中间这台告成开挂—— 不光能跨滴滴、高德等平台一齐叫车,还懂智能兜底:独一有一个平台先接单,立马自动取消其他平台的订单,无谓你盯入辖下手机走动切。
如实把打车这件事重新到尾办利索了,跨出了要害一步。
换到更测验 有贪图力”的购物任务 ——“帮我找《红楼梦》有莫得优惠,有的话告成下单”,差距依然。
当傍边两位还在念念考或卡在某个表率时,中间这位还是行云活水般走收场多平台比价、领券、加购物车的全历程。
当任务从入手操作转向动脑问答时,双方AI的发扬开动出现明显的波动。
输出行业敷陈、识别汽车零件、谋划跨界合营,以及搪塞护照被偷的济急惩办、探讨自动驾驶的伦理窘境、分析热门这些问题上,恢复质地时高时低,念念路时清醒时拖拉,显得不太雄厚。
比较之下,中间的选手在这一系列任务中都保握了结构清醒、内容塌实、实行可靠的高水准,雄厚且优秀。
考完使命里的效用题,现场紧接着便测了一番生存里的细碎活,毕竟过日子的浮泛可比作念报表杂多了。
奶茶要三分糖如故全糖、点外卖凑几个菜才不铺张、查快递无谓翻遍APP、记清每个平台的小号密码…… 这些日常小事,AI 能接得住吗?
限度看下来,AI 们的发扬跟使命关差未几,如故有东谈主实干、有东谈主划水。
挑西瓜,傍边双方属于免责声明拉满、实事少许不干。
中间的选手不但表面输出最全面,实干发扬也稀奇可得住,现场东谈主工吃瓜实测,如实选出了最甜的西瓜。
切换到估算丝瓜汤热量、识别植物与猫咪品种、查找滑雪攻略、分析“牛肉面不要面”的饮食表象、查询淘宝物流景色、查找账号密码、聊穿搭、聊健身、聊体检、写全球点评评述、剧荒推选比赛、作念购物作业等等这些任务,差距就时大时小了。
傍边双方的选手而能给出实用淡薄,时而只可提供泛泛之谈,发扬难以瞻望。中间的选腕发扬则依旧雄厚。
这一轮再次解说,真碰巧用的AI不仅要懂得更多表面,更要能将拖拉的表面素质,滚动为可靠的骨子行径。
除了干活麻利、会点外卖,我们对AI大致还有更深层的期待——它能不可脱离东谈主机感,在相易时给我们更多的追随感、更懂我?
这一轮的要害问题,一个测验的是创意——“帮我把这张像片,布景P成赛车场/修出赛博一又克的作风。”
能看到基础的图片PS、生成方面,三台手机都能勾通需求、托福后果,但细看之下,右边的抠图踪迹会比较明显,中间的发扬会更接近主流图像生成模子的水准。
另一个要害问题,测验的则既是见识又是情商——“你认为,像片里的小男孩,长大了会成为什么样的东谈主?”
傍边两位的恢复,像是标准模板,先容了陈震的生平事业。
而中间的选手,却给出了一段充满细节和温度的描绘。它仿佛在尝试为像片的东谈主物写列传故事,研讨事实给出了一个既真实又好玩、可读性拉满的恢复。
这一刻,你嗅觉到的不是用具在应答,而是一个东谈主在给你讲故事。
此外,在“财务解放为何还要使命”、“醉心酿成使命是福是祸”、“心情不好推选歌曲”“指点为什么爱放工开会”“检讨错别字”“高强度上班后混沌”“前共事成婚该不该随份子”“steam最新有什么好玩游戏”“玩忽感是不是天生的”“赞理怼黑粉”等问题上,三台AI的才调水平也趋于一致,只不外中间选手的恢复会更接近真东谈主对话体验。
总的来说,在这轮测试里荣耀Magic8 Pro的发扬是最能打的。
举座来看,在使命、生存与情绪价值三个维度、一百个问题的测验中,荣耀Magic8 Pro全面胜出。
在使命场景,它能精确勾通并当作手替实行一连串的提醒;在生存界限,它能勾通复杂提醒、自行念念考然后操作服务;在情绪价值层面,它更能提供具有活东谈主感的互动体验,岂论是办正事如故聊闲天,都让东谈主认为更好用、更懂东谈主。
说真话,看完荣耀 Magic8 Pro 在百题测试里的发扬,不少东谈主应该会跟我不异目下一亮:正本 AI 手机不仅仅喊个提醒出限度,还能确切像个搭子不异,把出差打车、日常点单这些浮泛事给扛了,致使聊老照已而还能说几句暖话。
但YOYO此次的发扬,真能成为AI手机引爆市集的“第一枪”吗?
它会像几年前的ChatGPT那样,整夜之间卷起时间风波,逼出更多远大的敌手,也逼出更快进化的我方吗?
我们期待谜底是Yes,但逸想终究需要技巧来考证。
说到底,一花独放不是春。
手机市集,恭候一个委果的“新故事”还是太久。
当“one more thing”式的改进缓缓放缓,当影像赛谈已卷至像素与传感器的极限,厂商们还能在高阶战场上亮出什么新项目?
AI,恰是这个存量时间最被看好的冲突口。但它究竟能为体验带来些许真实擢升、为市集带来些许新增量,仍需要一场又一场像这么的实战来考证。
我们期待百花皆放的AI,能通过良性的竞争,更快地、委果地把改日,鼓动每个东谈主的手中。
本文由极果用户极果媒体原创开云kaiyun中国官方网站