刚刚发布了水果番茄(Watermelon Todo),这是一个支持语音输入的待办事项应用,适用于iPhone和iPad。它最初是一款老旧的应用,但这版基本是从头开始重构——大约需要3个月时间,几乎所有时间都花在了一个问题上:最快的方法是什么,才能把事情从脑子里移到待办事项列表里?
核心思想:无论何时都按住说话
在手机上输入文字是精确的,但速度很慢。我的猜测是,最快的捕捉方法是:按住一个按钮,随口说出脑子里的想法,松开。
- 按住主要按钮,胡乱说出想法——“明天打电话给牙医,周五前买个礼物给妈妈,研究税务”——它会把这些内容分成单独的任务,清理好,分类,提取出日期和提醒。
- 每个任务卡片本身就是一个按住说话的按钮。按住一个任务,随口说出“推迟到下周,9点提醒我”。正在按住的任务是上下文,所以不需要“关于我的第三个任务…”这样的前言——编辑只需要按一下和说一个句子。
语音识别在设备上运行,应用不需要账户。
我在开发过程中学习了几件事(对开发者来说):
- 苹果的实时语音识别器是区域锁定的。它们永远不会自动检测语言——带有英语UI的中国语音识别为废话。我最终使用了设备上快速检测语言的第一秒左右的音频并在录音过程中重新启动识别会话,在正确的区域中。无论如何它都不会被注意到——这才是周末吃掉的那种事。
- 智能功能应该退化,而不是锁定。任务解析智能功能通过一层次的链条运行——设备上的苹果智能功能可用时,云端可选,使用自己的API密钥如果你喜欢,关键词规则作为底层。任何不可用时都会默默地掉过。关闭每个引擎,它仍然是一个快速的语音待办事项列表;核心循环中从未等待服务器。
- 上下文比聪明才干更重要。最大的准确性胜利来自于UX提供的解析器——按下的任务,当前日期,已有的截止日期——而不是从调优解析本身。设计交互方式,使软件已经知道你意味着什么。
我现在需要的是:真实的用户和对捕捉流程的诚实反馈。激烈的反馈也欢迎——乐意回答任何关于应用或它是如何构建的。
评论 (0)