吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2596|回复: 49
收起左侧

[Python 原创] 免翻免费:python调用Mistral的API实现PDF文件和图片OCR识别

  [复制链接]
lianxiang1122 发表于 2025-3-11 18:12
如果你不想花钱就调用AI的API接口,可以用谷歌,但是需要翻。。。最近发现Mistral也可以,来自欧洲的AI,免翻还不用充值。。。支持OCR调用。

先登录官网:https://mistral.ai,点击右上方的“try the API",弹出登录页面,直接用微软账号登录,话说该拥有个微软账号了,某度广告泛滥,bing是个不错的选择。

image.png


使用微软账号登录。
image.png

登陆后,就进入API申请页面了,点击左侧的API key,
image.png
创建一个key,并复制下来,因为关闭页面后就不可再看该KEY了,如果以后忘了,可以删除后,再创建,提示可以创建10个。
image.png

好了,有了Key了,就可以愉快的玩耍了。。。。
怎么用呢?看官方教程,点击docs,再点击左侧的OCR。。。
当然了,用python第一步是要装库的,pip install mistralai,硬装就行了

image.png


例如,我们转换一个扫描版的PDF文件为MD格式,找到文档的OCR with uploaded PDF,将下面的代码复制到IDE中,修改下KEY和文件名就行了。

image.png

参考代码如下:

[Python] 纯文本查看 复制代码
import os
from mistralai import Mistral

api_key = "你的API Key"

client = Mistral(api_key=api_key)

uploaded_pdf = client.files.upload(
    file={
        "file_name": "2.pdf",
        "content": open("2.pdf", "rb"),
    },
    purpose="ocr"
)  

client.files.retrieve(file_id=uploaded_pdf.id)

signed_url = client.files.get_signed_url(file_id=uploaded_pdf.id)

ocr_response = client.ocr.process(
    model="mistral-ocr-latest",
    document={
        "type": "document_url",
        "document_url": signed_url.url,
    }
)

print(ocr_response)


结果如下:
image.png

如何转成MD格式呢?我们观察一下这个结果ocr_response里面的pages是一个列表,可以自己把ocr_response.pages打印出来看一下,其实列表里面的项就是mistral识别到的PDF文件的每一页,一页一个列表的项。
image.png

先测试一下第一项ocr_response.pages[0],虽然有点复杂,但是里面有一个markdown,我们可以打印出来看一下

image.png


打印markdown,里面就是MD格式的内容,接下来就方便了,直接另存为MD格式就行了。

print(ocr_response.pages[0].markdown)

image.png

另存为MD格式参考代码:
[Python] 纯文本查看 复制代码
# 将字符串保存为 Markdown 文件
with open("example.md", "w", encoding="utf-8") as file:
    file.write(content)

print("Markdown 文件已保存为 'example.md'")


如果多页的话,我们用for循环一下ocr_response.pages,再拼接一下另存为MD就行了。

PDF搞定了,图片就简单了,按照教程做就行了,不在重复了。另外,他还能理解文档,这个没测试,小伙伴们自己玩一下吧。

好了,就分享到这里了。有疑问随时沟通。



免费评分

参与人数 9吾爱币 +9 热心值 +9 收起 理由
stone12315 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
苏紫方璇 + 3 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
xinxin99 + 1 + 1 谢谢@Thanks!
7086pp + 1 + 1 用心讨论,共获提升!
蔷薇的羽翼 + 1 + 1 我很赞同!
Functionzy + 1 我很赞同!
889_ + 1 + 1 我很赞同!
shanzhanzhe + 1 + 1 谢谢@Thanks!
nt0114 + 1 热心回复!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| lianxiang1122 发表于 2025-3-12 17:09
pyjiujiu 发表于 2025-3-12 15:07
谢谢分享,看新闻说是中文支持不太好,不过看楼主的好像还不错

嗯嗯,AI也在进化这些天用下来感觉很好用。。。。
 楼主| lianxiang1122 发表于 2025-3-12 17:08
laozhang4201 发表于 2025-3-12 14:56
哦。我也只是遇到过一次,也许我当时碰巧遇上的吧。看来是想多了。

哈哈哈,我感觉只要别用来做违法的事,都懒得搭理你。。。。
wudavid33 发表于 2025-3-11 21:13
hun8461 发表于 2025-3-11 21:49
可以识别中文吗?
 楼主| lianxiang1122 发表于 2025-3-11 22:42
hun8461 发表于 2025-3-11 21:49
可以识别中文吗?

可以,不区分语言种类,自动识别。。。但是对文件有没有大小限制就不知道了。。。。。
4a3e57cb-52f5-459d-8dee-bfb93b22585a.png
sdieedu 发表于 2025-3-12 06:21
看起来不错
sdieedu 发表于 2025-3-12 07:06
看起来很强大
masteryun 发表于 2025-3-12 08:09
能保留排版格式吗?还是只是提取文本?
user_0628 发表于 2025-3-12 08:33
看起来很强大
zhaohainuo 发表于 2025-3-12 09:10
感谢分享,速度去尝试
tailor001 发表于 2025-3-12 09:11
不让创建key呀,没有计划
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-6-17 05:43

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表