微软LlamaParse携手GPT-4o系列，文档解析与生成能力再上新台阶-快讯-智快网

微软LlamaParse携手GPT-4o系列，文档解析与生成能力再上新台阶

发布时间：2024-11-28 14:10 来源：ITBEAR 作者：柳晴雪

微软近日在其官方博客上宣布了一项重大更新，将Azure OpenAI端点集成到其LlamaParse文档中解析器中，这一举措标志着微软在生成式人工智能领域迈出了重要一步。

LlamaParse，作为微软专为生成式人工智能（GenAI）打造的文档解析器，其核心功能在于解析和清理各类文档数据，确保数据质量上乘，为下游大型语言模型（LLM）提供坚实支撑。此次集成Azure OpenAI端点，无疑为LlamaParse增添了新的动力。

通过集成Azure OpenAI的GPT-4o系列模型，LlamaParse现在能够更高效地提取非结构化数据，并实现文档转换。Azure OpenAI强大的语言模型能力与LlamaParse的高效解析能力相结合，使得文档处理更加精准、智能。用户现在可以直接在LlamaParse中调用GPT-4o和GPT-4o-mini等模型，享受前所未有的文档处理体验。

不仅如此，LlamaParse还新增了多模态文档解析功能，这得益于Azure OpenAI的多模态支持。现在，用户可以处理包含图像、文本、音频等多种模态的文档，进一步拓宽了文档处理的边界。同时，LLM优化的输出也大大增强了检索和语义搜索的效果，使得用户能够更快速地找到所需信息。

在数据摄取方面，LlamaParse通过LlamaIndex无缝连接到Azure AI Search的向量存储库中。这一功能使得用户能够轻松地将解析后的内容分块、嵌入和索引，为后续的搜索和生成提供有力支持。企业级的安全性和合规性也为敏感工作负载提供了有力保障。

现在，用户可以利用LlamaCloud、Azure AI Search和Azure OpenAI构建一个完整的检索增强生成（RAG）工作流程。具体步骤包括：首先使用LlamaParse Premium和Azure OpenAI进行高级文档提取，生成Markdown、LaTeX和Mermaid图表等多种格式的LLM优化输出；然后使用Azure AI Search作为向量存储，并利用Azure AI模型目录中的嵌入模型对解析后的内容进行分块、嵌入和索引；最后利用Azure AI Search的查询重写和语义重新排序功能提升检索质量，并通过Llamaindex编排Azure AI Search和Azure OpenAI，构建生成式AI应用。

这一工作流程的推出，不仅为用户提供了更便捷、高效的文档处理方式，也进一步推动了生成式人工智能技术的发展。微软将继续致力于技术创新，为用户提供更多优质的人工智能产品和服务。

更多>同类内容