使用 Telnyx AI 推理构建一个简单的 RAG 应用

本教程展示了如何利用 Telnyx AI 推理服务构建一个简单的检索增强生成（RAG）应用。通过结合外部数据检索与 Telnyx 的大语言模型推理能力，开发者可以快速创建能基于自有知识库回答问题的智能应用。项目提供了完整的 Python 代码示例，涵盖文档嵌入、向量检索和生成回答等核心步骤。

背景速读

- Telnyx 是一家美国通信 API 公司，近期推出了 AI Inference 服务，允许开发者通过 API 调用开源大模型（如 Llama、Mistral），无需自行部署 GPU。 - RAG（检索增强生成）是当前最流行的 AI 应用架构之一：先从一个文档库（如 PDF、网页）中检索相关内容，再将这些内容作为上下文提供给大模型，让模型基于真实资料回答，而不是凭空编造。 - 这个仓库展示的是用 Python 和 Telnyx 的 AI Inference API 搭建一个最小可用的 RAG 应用，流程包括：加载文档 → 切分文本 → 生成向量嵌入 → 存入向量数据库 → 根据用户问题检索最相关的文本段 → 把检索结果连同问题一起发给大模型生成回答。 - 这种"开源模型 + 托管 API"的组合，让中小团队可以在不采购高价显卡、不管理复杂基础设施的情况下，快速搭建企业级知识库问答系统。