会员服务
default sy_dh
在线客服
​推特看到关于GPT-4的预测,103万查看[胜利]。 如果GPT-4是多模态的,我 - AI副业赚钱 - 富裕者联盟社区 - Affiliate营销圈

回答

收藏

​推特看到关于GPT-4的预测,103万查看[胜利]。 如果GPT-4是多模态的,我

AI副业赚钱 AI副业赚钱 268 人阅读 | 0 人回复 | 2023-03-12

​推特看到关于GPT-4的预测,103万查看[胜利]。

如果GPT-4是多模态的,我们可以合理地预测GPT-4可能具备什么能力,考虑到微软之前的工作Kosmos-1:
- 视觉智商测试:是的,就是人类参加的那种!
- 无OCR阅读理解:输入屏幕截图、扫描文档、街道标志或任何包含文本像素。直接推断内容而不需要明确使用OCR。这对于在多媒体网页上解锁AI应用程序或来自真实世界摄像头的“野外文字”非常有用。
- 多模态聊天:关于一张图片进行对话。甚至可以在中途提供“后续”图像。
- 广泛的视觉理解能力,如字幕、视觉问答、物体检测、场景布局、常识推理等。
- 音频和语音识别(?):没有在Kosmos-1论文中提到,但Wh






加入社区,可阅读全站10w+资源

 非会员试读19%,加入社区后可阅读全文 

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
分享到:
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭