惊爆!苹果 AI 的首批体验震撼登场!Siri 发生了天翻地覆的变化,其 AI 写作能力更是瞬间碾压大批应用!

🐱 个人主页:TechCodeAI启航,公众号:TechCodeAI

🙋‍♂️ 作者简介:2020参加工作,专注于前端各领域技术,共同学习共同进步,一起加油呀!

💫 优质专栏:AI相关最新技术分享(目前在向AI方向发展,欢迎大佬交流)

📢 资料领取:前端进阶资料可以找我免费领取

🔥 摸鱼学习交流:我们的宗旨是在「工作中摸鱼,摸鱼中进步」,期待大佬一起来摸鱼!

令人瞩目的 Apple Intelligence 在今日总算现身了,然而,却又并非是完完全全地到来。

伴随 iOS 18.1 Beta 版的成功推送,自此刻起,注册开发者已然能够率先领略到部分来自苹果的 AI 功能。

众多提前尝鲜的海外网友早已沉浸其中,玩得不亦乐乎。其火爆程度通过下图便可清晰知晓:

图片

从贯穿整个系统的写作工具,到最为关键的 Siri,让我们一同来领略由苹果所定义的 Apple 智能。

图片

介绍之前,首先来讲一讲体验的前置条件:

iOS 18.1 Beta 版仅限注册开发者使用,普通用户需等待。

建议将设备地区设为美国,并将 Siri 语言设为英语。

仅 M 系列和 A17 Pro 芯片设备兼容,比如最新版 Pro/Pro Max。

用户需在设置中加入候补名单,目前通过速度比较快。

图片

Siri:UI 界面大不同,但还是那么不聪明

博主 @Brandon Butch 在 YouTube 上分享了他第一时间的实测结果。

就分享的视频信息来看,新版 Siri 拥有了崭新的 UI 设计,看起来更酷炫了,像触发后会存有一个跑马灯的效果,并且附带一个触发的音效。

图片

然而,iOS 18 Beta 1 中的 Siri 仍处于 1.0 版本,尚未接入 ChatGPT,预计其 2.0 版本会在 2025 年推出。

也正因如此,Siri 的智商还有待提升,例如当博主询问 Siri 4 个小时后的具体时间时,Siri 只是淡淡地回了一句「To who」。

召唤 Siri 的方式增添了新的一种,轻轻点击一下 iPhone 底部就会有横条亮起,且点击两次就能把 Siri 调出。

图片

渐变色的新键盘界面与全新的文字输入相搭配,这回 Siri 确实有了很大的变化。而且貌似打字版的 Siri 还能够回答那些语音回答不了的问题。

为了让你好好说话,Writing tools 操碎了心

几个月以前,我们所定义的 Apple Intelligence 是,Apple 智能是天生就属于系统的功能,而这在新更新的 Writing tools(写作工具)功能里表现得极为淋漓尽致。

爱范儿

,赞24

在信息、备忘录里进行文字输入,你就会看到手机键盘的右上方有一个 Apple 智能按钮,点击之后即可得到完整的写作工具功能,包含但不限于三种不同类型重写句子的办法——“友好”“专业”“简洁”。

总之,这项功能的作用是帮助你找到一个更好的途径来表达你内心真正想说的话。

图片

与友人聊天之际,让 AI 掌控语调的轻重缓急,避免不必要的误解与矛盾,既能够使其书写得更为专业、更为友好,也能够更简洁。对于不太善于言辞的低情商 i 人而言,这无疑是宝藏般的功能。

网友 @techdroider 也对比了与三星 Galaxy AI 类似功能的表现。没有任何悬念,「Apple 智能 1:0 三星 Galaxy AI 」。

图片

当然,要是您对写作工具修改后的措辞没有兴趣,那照样能一键还原,就是这般任性。

而且,这一功能于 Safari 也可行,长按选定段落,然后写作工具就会弹出,之后自行执行前述操作。

图片

而摘要、分点总结等功能更适合用于长文阅读。

作为一名邮箱被外网新闻报道塞满的编辑,现在能够通过页面右上角的默认摘要按钮帮我们提高工作效率,只需一键就能生成摘要,节省的时间绝非一星半点。

图片

点击按钮之后,Apple 智能将会自动浏览和阅读信息,仅需大约 1 分钟左右的时间,就会在顶部留下简洁有力的摘要,即便是普通的电子邮件,此功能也同样适用。

写作工具里所提供的「prooffread(校对)」更是语法错误的克星。输入文字后,校对错误的记录清晰可见,哪怕是标点符号使用不规范,它都能够为您指出。

图片

通话录音:寄予期待,也不失期待

心心念念许久的通话录音功能终于现身了。

怎样去录制?录音的效果好不好?识别准不准确?一条视频跟您讲透彻。

通话期间,点击左上角新增的录音键,便能开启录音,同时对方的电话里面也会收到录音已开启的语音提示。

爱范儿

,赞119

通话结束后,录音文件会自动保存至备忘录当中,其中不但有音频文件,还存在实时转录的语音文字。

与此同时,录音文件也能够转存至文件 App 里,录音文件为 m4a 格式,整体的录音文件会被压缩得很小,所以最终的效果只能说是勉强能听,并且转录的文字还能够区分发言人。

图片

另外,我们还对方言的转录效果进行了测试,不妨点击观看上方的视频号吧。像是和普通话较为接近的北方方言,其转录的效果就相对精准,然而像粤语这类和普通话差别较大的方言,或许 iPhone 就不太能听懂了。

怎么样,对这个功能您还满意吗?

另外,还有一些小功能,例如用户能够通过自然语言创建幻灯片,以及搜索特定的照片和视频等。

Apple 智能内部更多细节曝光

在之前的文章中,我们简单揭秘了 Apple 智能是怎么炼成的,甚至即使没有 GPT-4o 也能打。

而在今天,苹果也发布了全面的技术报告,披露了关于 Apple 智能的更多细节。

先来感受一下苹果官方给出的测试结果:

图片

图片

图片

图片

图片

向左滑动查看更多内容

图片

简单来讲,这份技术报告详尽阐述了 3B 参数大小的端侧模型 AFM-on-device,还有一种参数更大的云端模型 AFM-server。

苹果的报告表明,前者端侧模型主要用于达成摘要的功能,例如适用于上文提及的电子邮件、消息和通知的摘要。苹果还特意与设计团队合作确立了电子邮件、消息和通知摘要的规范。

虽然端侧模型在生成一般摘要时表现不错,但难以生成完全符合规范的摘要。为处理这一问题,项目团队在 AFM 端侧模型上运用了 LoRA 适配器进行微调,以提升摘要生成的准确性。

后者云端模型则依据规则的过滤器采用启发式手段,如长度、格式、视角和语态限制;基于模型的过滤器用于应对更为复杂的摘要问题,以此提高摘要的质量。

图片

AI 发展的三要素无非算法、数据和算力。

在数据层面,AFM 预训练数据集是由多种高品质的数据相互混合构成的。这当中涵盖了苹果从出版商那里获取授权的数据、精心筹备的公开可用或开源数据集,还有由网络爬虫 Applebot 抓取的公开可用信息。

其中报告还着重提及了尊重网页使用标准的 robots.txt 指令选择不让 Applebot 抓取的权利,不太对劲,怎么有种在暗指 Anthropic 的感觉。

苹果也着重强调,训练数据里不存在任何私人的苹果用户数据,甚至专门过滤掉个人身份信息之后,才将其归入预训练混合数据当中。

值得留意的是,AFM 云端模型的核心训练是从零开始展开的,而 AFM 端侧模型则是通过蒸馏和剪枝从更大的模型里获取的。

在硬件方面采用了 Google TPU,其中云端和端侧分别使用了 8192 和 2048 颗 TPUv5p 芯片。

图片

要是你想在电脑上制作视频,那你得安装一些额外的应用程序。在 AI 模型的天地里,苹果模型背后使用的「适配器」也是如此。

简单来讲,适配器就是一些模型权重的小集合,如同一个小型的插件,让模型可以快速适应各类任务。

举例来说,模型处理邮件和通知的总结,看起来差不多,然而实际上有很多细微的不同,因而苹果给模型装上了一个叫 LoRA 的适配器,使它能够更好地完成这种任务。

附上技术报告全文:

https://machinelearning.apple.com/papers/apple\_intelligence\_foundation\_language\_models.pdf

图片

写在最后,不可否认的一个事实是,当下手机端侧 AI 不管是在技术方面还是产品应用方面都难以称得上成熟。

但也正因为这样,我们才会对苹果牌 AI 怀有极大的期望。

自苹果发布会之后,我们获取到的有关 Apple 智能的消息并不好。

在众多泄露出来的小道消息里,Apple 智能的推出日期也不断“跳票”。

就连最近彭博社也报道说,苹果会在 10 月底前给用户推送“Apple 智能”的软件升级,不过这要比今年发布的 iOS 18 和 iPadOS 18 操作系统还要晚好几周。

今天推出的 iOS 18.1 Beta 虽然只是公布了 Apple 智能的一些细微之处,但至少也让我们安了心。

那就是 Apple 智能至少不是虚无缥缈的,它正在朝我们靠近。

没错,我所指的就是 OpenAI 那个反面的例子,也就是官宣了大半年,还处于如同未来才有的状态的“期货”Sora。当然,我们也盼望 Apple 智能的完整面貌能够早日呈现,这对于消费者而言是一件好事,也能够给众多终端厂商做个榜样。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3281681.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot+Vue+kkFileView实现文档管理(文档上传、下载、在线预览)

场景 SpringBootVueOpenOffice实现文档管理(文档上传、下载、在线预览): SpringBootVueOpenOffice实现文档管理(文档上传、下载、在线预览)_霸道流氓气质的博客-CSDN博客_vue openoffice 上面在使用OpenOffice实现doc、excel、ppt等文档的管理和预览。 除此之外…

项目管理中的关键:进度管理

项目管理中,进度管理无疑占据了举足轻重的地位,它不仅关乎项目能否按时完成,更是衡量项目效率、成本控制及质量保障的重要标尺。 它要求管理者根据项目的总体目标,科学合理地制定项目进度计划,并在项目实施过程中进行…

AI写作|拆解小红书对标账号 只需简单手搓一个coze智能体(提示词+方法)

本文背景 我们都知道,要想在小红书上面搞到米,爆款笔记必不可少,平时我们也看过不少的关于如何制作爆款笔记的各种教程,但是抵不住太多太复杂,于是有没有一种办法能将这个工作交给AI来执行呢? 爆款笔记会涉…

《C++基础入门与实战进阶》专栏介绍

🚀 前言 本文是《C基础入门与实战进阶》专栏的说明贴(点击链接,跳转到专栏主页,欢迎订阅,持续更新…)。 专栏介绍:以多年的开发实战为基础,总结并讲解一些的C/C基础与项目实战进阶内…

Simulink仿真中出现“Output argument ‘y‘ is not assigned on some execution paths.”

在simulink中添加函数时,经常由于代码的不完全,导致在simulink仿真时经常会出现“Output argument y is not assigned on some execution paths. "的错误,这是由于在编写程序时,对于输出y的赋值没有考虑全面,如下…

Python酷库之旅-第三方库Pandas(055)

目录 一、用法精讲 206、pandas.Series.reset_index方法 206-1、语法 206-2、参数 206-3、功能 206-4、返回值 206-5、说明 206-6、用法 206-6-1、数据准备 206-6-2、代码示例 206-6-3、结果输出 207、pandas.Series.sample方法 207-1、语法 207-2、参数 207-3、…

Charles抓包工具系列文章(七)-- Rewrite工具的应用示例

一、背景 客户端通过域名访问后端服务,在api网关层,会判断path的前缀,默认/api开头的请求都转发至后端服务A。 当前缀是/assist/api开头,请求将转发至后端服务B(部署在192.168.80.226,便于测试对比) 在不改动kong网关配置的情况下,现需要把后者的请求转发至192.168.…

【基础篇】Docker 镜像管理 THREE

嘿,小伙伴们!我是小竹笋,一名热爱创作的工程师。在上一篇文章中,我们探讨了 Docker 的架构与关键组件。今天,让我们一起深入了解一下 Docker 镜像管理的相关知识吧! 📦 创建和管理镜像 镜像是…

IEEE计算智能学会深圳分会线上讲座 22-01期: 金耀初教授的科研经验分享

IEEE计算智能学会深圳分会线上讲座 22-01期: 金耀初教授的科研经验分享_哔哩哔哩_bilibili 非限定性定语从句,使用逗号和which、动名词搭配使用, 尽量避免使用被动语态。 obviously- 使用clearly,apparently感觉上更好。 In this study/work 后面的交…

C/C++文件IO常用函数总结

文章目录 1. 文件描述符2. 文件IO常用函数2.1打开文件:open2.2 关闭文件:close2.3 读写操作:read/write2.4 关于光标的操作:lseek 1. 文件描述符 文件描述符的本质是一个大于等于0的整数,在使用open函数打开文件时&am…

pychar安装、pychon安装、pycharm超过试用期30激活

如果pycharm超过试用期,可以双击vbs脚本重新激活 百度网盘: 链接: https://pan.baidu.com/s/1B-XyLOy3wjVWbJwuvZOHOw?pwdmsb6 提取码: msb6

【学术会议征稿】第六届经济管理与模型工程国际学术会议(ICEMME 2024)

第六届经济管理与模型工程国际学术会议(ICEMME 2024) 2024 6th International Conference on Economic Management and Model Engineering 第六届经济管理与模型工程国际学术会议(ICEMME 2024)将于2024年11月22-24日在中国大连…

Bugku-web-Flask_FileUpload

Bugku-web-Flask_FileUpload 查看源代码,提示用python返回结果 在file.jpg中写python代码 import os os.system(ls / )上传后查看源代码,找到flag文件夹 修改代码 import os os.system(cat /flag )

STM32的外部中断实现按键控制led灯亮灭(HAL库)

一:stm32外部中断概述 1:stm32的外部中断线 STM32的每个IO都可以作为外部中断输入。 STM32的中断控制器支持19个外部中断/事件请求: 线0~15:对应外部IO口的输入中断。 线16:连接到PVD输出。 线17:连接到R…

鸿蒙应用框架开发【首选项】 本地数据与文件

首选项 简介 本示例使用ohos.data.preferences接口,展示了使用首选项持久化存储数据的功能。 效果预览 使用说明 1.点击顶部titleBar的右侧切换按钮,弹出主题菜单,选择任意主题则切换相应的主题界面; 2.退出应用再重新进入&a…

智能合约中approve函数详解

场景 这段时间很多小伙伴加我、都咨询到了一个类似的业务场景、 如下: 1、第一步业务里面调用授权函数approve 、给指定address2、第二步是由授权的address调用transferFrom转移给指定的接受地址。 案例DEMO如下(这里test2肯定是会执行失败的&#xff…

相机标定(Camera Calibration)

什么是 相机标定(Camera Calibration)? 相机标定(CameraCalibration)是确定相机内部参数(如焦距、光学中心、畸变系数等)和外部参数(如相机在世界坐标系中的位置和姿态)的…

Jackson常用注解详解

Hi 👋, Im shy 有人见尘埃,有人见星辰 Jackson常用注解详解 文章目录 Jackson常用注解详解0. 引入依赖1. JsonProperty2. JsonIgnore3. JsonFormat4. JsonInclude5. JsonCreator6. JsonValue7. JsonIgnoreProperties结论 Jackson是Java生态系统中广泛…

【Canvas与艺术】三环莫比乌斯圈

【成图】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>三环莫比乌斯圈</title><style type"text/css"&g…

插单现象对PMC造成的影响有哪些?

插单&#xff0c;即在生产制造过程中&#xff0c;客户或其他部门临时增加订单&#xff0c;这一行为如同战场上的突袭&#xff0c;让生产与物料控制&#xff08;PMC&#xff09;部门措手不及&#xff0c;面临着前所未有的压力和挑战。那么&#xff0c;插单现象究竟对PMC造成了哪…