以文档处理为例讲解豆包API调用教程(Python)

 更新时间:2025年01月03日 10:52:35   作者:JungleZhang0719  
这篇文章主要介绍了如何在Linux服务器上配置和使用豆包大模型的API,通过API处理200万字的文档,展现了技术的发展和应用,需要的朋友可以参考下

一、前言:

现在大模型api价格越来越便宜了,豆包大模型分为 lite 和 pro, 其中pro 32k 大模型的 api 价格在 0.0008元/千tokens,作为普通人能够用非常低的价格享受世界上最先进的科技,让我惊叹于技术的发展。

刚好手上有差不多200w字的文档要处理,我们这里选择 Doubao-pro-32k 的模型,换算成人民币差不多两块钱(再次震惊)。

备注:这篇文章要求一点点基础,这里默认你在 Linux 服务器上操作、已经有 Conda 环境、Python 版本大于 3.7、会基础的 Linux 命令、并且看得懂简单的 Python代码。

二、配置环境

直接在 Windows 上安装豆包的库会报错:

note: This error originates from a subprocess, and is likely not a problem with pip.
  ERROR: Failed building wheel for volcengine-python-sdk
  Running setup.py clean for volcengine-python-sdk
Failed to build volcengine-python-sdk
ERROR: Could not build wheels for volcengine-python-sdk, which is required to install pyproject.toml-based projects

这是因为 Windows 系统有最长路径限制,解决办法是自己看官方文档。我们这里还是以 Ubuntu 为例,在命令行输入:

pip install 'volcengine-python-sdk[ark]'

控制台获取api key:

复制以后将 ARK_API_KEY 设置为全局变量,在命令行输入:

export ARK_API_KEY="你刚才创建的API-key"

然后我们去创建“模型推理接入点”:登录火山方舟平台,点击左侧导航栏中的【在线推理】,点击【 创建推理接入点 】。

然后复制生成的ENDPOINT_ID

在命令行输入:

export ENDPOINT_ID="你的ENDPOINT_ID"

这样就完成了环境配置

三、调用 API

执行代码:

from volcenginesdkarkruntime import Ark
import os

client = Ark()

print("----- standard request -----")
completion = client.chat.completions.create(
    model=os.getenv('ENDPOINT_ID'),
    messages = [
        {"role": "system", "content": "你是豆包,是由字节跳动开发的 AI 人工智能助手"},
        {"role": "user", "content": "常见的十字花科植物有哪些?"},
    ],
)

print(completion.choices[0].message.content)

成功输出: 

----- standard request -----
十字花科是一个较大的科,包含许多常见的蔬菜和花卉。以下是一些常见的十字花科植物:
- **蔬菜**:
    - **白菜类**:包括大白菜、小白菜、菜心等。
    - **甘蓝类**:如结球甘蓝(卷心菜)、羽衣甘蓝、抱子甘蓝等。
    - **芥菜类**:有茎用芥菜(榨菜)、叶用芥菜(雪里蕻)、根用芥菜(大头菜)等。
    - **萝卜类**:常见的有红萝卜、白萝卜、青萝卜等。
    - **其他**:还有花椰菜(菜花)、西兰花、油菜、荠菜等。
- **花卉**:
    - **紫罗兰**:是十字花科紫罗兰属的二年生或多年生草本植物,花朵通常为紫色。
    - **桂竹香**:属于十字花科桂竹香属,是一种多年生草本植物,花色丰富,有黄色、橙色、红色等。
    - **诸葛菜**:又名二月兰,是十字花科诸葛菜属的一年或二年生草本植物,蓝紫色的花在每年的 4-5 月盛开。
    - **香雪球**:是十字花科香雪球属的多年生草本植物,花朵小而密集,呈白色、淡紫色或紫红色。

这只是十字花科植物的一小部分,该科还包括许多其他的蔬菜和花卉。十字花科植物的特点是花朵呈十字形排列,果实为角果。这些植物在人们的生活中具有重要的经济和观赏价值。

参考:

总结

到此这篇关于以文档处理为例讲解豆包API调用教程的文章就介绍到这了,更多相关豆包API调用文档处理内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python编程开发之类型转换convert实例分析

    python编程开发之类型转换convert实例分析

    这篇文章主要介绍了python编程开发之类型转换convert用法,结合实例形式分析了Python中常见的数据类型及类型转换convert的具体使用方法,需要的朋友可以参考下
    2015-11-11
  • python 循环读取txt文档 并转换成csv的方法

    python 循环读取txt文档 并转换成csv的方法

    今天小编就为大家分享一篇python 循环读取txt文档 并转换成csv的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • 在PyCharm中控制台输出日志分层级分颜色显示的方法

    在PyCharm中控制台输出日志分层级分颜色显示的方法

    今天小编就为大家分享一篇在PyCharm中控制台输出日志分层级分颜色显示的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • 深入理解numpy广播机制

    深入理解numpy广播机制

    广播(Broadcast)是 numpy 对不同形状(shape)的数组进行数值计算的方式,本文深入理解numpy广播机制,具有一定的参考价值,感兴趣的可以了解一下
    2023-09-09
  • python爬虫添加请求头代码实例

    python爬虫添加请求头代码实例

    这篇文章主要介绍了python爬虫添加请求头代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12
  • Python实现一个自助取数查询工具

    Python实现一个自助取数查询工具

    在数据生产应用部门,取数分析是一个很常见的需求,实际上业务人员需求时刻变化,最高效的方式是让业务部门自己来取,减少不必要的重复劳动,本文介绍如何用Python实现一个自助取数查询工具
    2021-06-06
  • Python人工智能之路 jieba gensim 最好别分家之最简单的相似度实现

    Python人工智能之路 jieba gensim 最好别分家之最简单的相似度实现

    这篇文章主要介绍了Python人工智能之路 jieba gensim 最好别分家之最简单的相似度实现 ,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-08-08
  • Python代码打开本地.mp4格式文件的方法

    Python代码打开本地.mp4格式文件的方法

    今天小编就为大家分享一篇Python代码打开本地.mp4格式文件的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • Python + Selenium 实现模拟登录jd实例分享

    Python + Selenium 实现模拟登录jd实例分享

    这篇文章主要介绍了Python + Selenium 实现模拟登录jd实例分享的相关资料,需要的朋友可以参考下
    2023-06-06
  • Python解惑之True和False详解

    Python解惑之True和False详解

    这篇文章主要给大家介绍了关于Python中常用的数据类型bool(布尔)类型的两个值:True和False的相关资料,通过示例代码给大家进行了解惑,让对这两个值有所疑惑的朋友们能有起到一定的帮助,需要的朋友下面来一起看看吧。
    2017-04-04

最新评论