附加文件
点击聊天输入栏左侧的 +(添加)按钮,打开附件选择器。你可以通过以下方式添加内容:相机
当场拍照,图片将保存到应用存储并立即附加。
相册 / 文件
从设备中选择一个或多个图片或文档。支持的文档类型包括 PDF、DOCX、PPTX 和 EPUB。
从剪贴板粘贴
从其他应用中复制图片,点击输入框后粘贴,Rikka 会自动识别并附加该图片。
从其他应用分享
使用 Android 的分享功能将文件或图片发送到 Rikka,分享的内容会预先填入输入栏,可直接发送。
图片
当你附加图片且所选模型支持视觉输入时,Rikka 会将图片编码为 base64 并直接传递给模型。模型会将图片作为对话的一部分进行处理。 图片附件标签会显示缩略图,便于你在发送前确认附加了正确的文件。并非所有模型都支持图片输入。如果你选择的模型不接受图像模态,Rikka 会自动回退到 OCR——详见下方的 OCR 部分。
文档:PDF、DOCX、PPTX 和 EPUB
Rikka 原生支持以下文档类型:| 格式 | 扩展名 | MIME 类型 |
|---|---|---|
.pdf | application/pdf | |
| Word | .docx | application/vnd.openxmlformats-officedocument.wordprocessingml.document |
| PowerPoint | .pptx | application/vnd.openxmlformats-officedocument.presentationml.presentation |
| 电子书 | .epub | application/epub+zip |
OCR——从图片中提取文字
如果当前模型不支持图片输入(即缺少视觉模态),Rikka 会使用你指定的另一个支持视觉的模型,对附加的图片自动运行 OCR。文件大小与模型支持
附加文件时请注意以下实际限制:- 图片大小 — 大图片以 base64 传递,会显著增加 Token 消耗。附加前请将超大图片缩小,以避免达到上下文限制。
- 文档长度 — 文档的完整提取文字会注入提示词中。几百页的 PDF 很容易超出标准的 8k Token 上下文窗口。处理长文档时请使用支持长上下文窗口(如 128k Token)的模型。
- 模型能力 — 并非每个服务商或模型层级都开放了视觉或文档 API。请查阅服务商文档,确认特定模型支持哪些输入模态。
附加文件前,请务必查阅服务商文档以确认模型支持的输入类型。Rikka 会自动检测图像模态,但文档处理始终通过文字提取完成,与模型能力无关。