2神仙道24 年另类 AI 评测尺度走红:“威尔・史女
发表时间:2025年01月03日浏览量:
专题:聚焦AI
IT之家 1 月 1 日新闻,据 TechCrunch 报道,跟着人工智能视频天生技巧的一直开展,一个风趣的景象开端在业内风行:当一家公司宣布全新的人工智能视频天生器时,仿佛总有人会第一时光用它来制造威尔・史女士吃意年夜利面的视频。这不只演化成了一种收集热梗,更成为权衡新型 AI 视频天生器机能的非官方基准 —— 测验其是否真切地浮现史女士饥不择食吃面的场景。史女士自己也在往年仲春经由过程 Instagram 宣布了一段模拟视频,亲身参加了这场收集狂欢。IT之家留神到,“威尔・史女士吃意年夜利面”只是 2024 年人工智能范畴浩繁独特“非官方”评测尺度中的一个,此前另有一位 16 岁的开辟者开辟了一款利用顺序,让人工智能把持《我的天下》(Minecraft)游戏,并以此测试其建造计划才能。与此同时,另有一位英国顺序员创立了一个平台,让人工智能在“你画我猜”(Pictionary)跟“四子棋”(Connect 4)等游戏中彼此对战。人工智能范畴不乏更学术化的机能测试,那么为何这些略显独特的测试反而可能敏捷走红呢?起因之一在于,很多行业尺度的人工智能基准测试对一般人来说过于艰涩难明。企业常常标榜其人工智能在奥林匹克数学比赛或博士级别困难中的解题才能,但年夜少数人应用谈天呆板人只是为了谈天或复兴电子邮件。即便是行业内广泛采取的评测方式,也未必更无效或更具信息量。以遭到浩繁人工智能喜好者跟开辟者亲密存眷的大众基准测试平台“谈天呆板人竞技场”(Chatbot Arena)为例,其容许任何收集用户对 AI 在特定义务上的表示停止评分,比方创立网页利用顺序或天生图像。但参加评分的用户每每不存在代表性,他们年夜多来自人工智能跟科技行业,而且他们的投票也经常基于团体且难以捉摸的偏好。像“四子棋”“我的天下”跟“威尔・史女士吃面条”这类独特的人工智能基准测试显然不是谨严的实证研讨,乃至不具有广泛实用性。由于即使 AI 可能完善天生“威尔・史女士吃面条”的视频,也并不料味着其能很好地天生汉堡的图像。这些另类的 AI 基准测试可能在短期内不会消散,究竟它们不只存在文娱性,并且还易于懂得。2025 年,又会有哪些离奇的基准测试会走红呢?告白申明:文内含有的对外跳转链接(包含不限于超链接、二维码、口令等情势),用于通报更多信息,节俭甄选时光,成果仅供参考,IT之家全部文章均包括本申明。
]article_adlist-->
申明:新浪网独家稿件,未经受权制止转载。 -->