Lei Xia

Sr. Software Engineer | Solution Architect

抒写代码,尽享生活,筑就未来。

订阅 · 赞赏

avatar

利用互联网检索优化RAG模型的时效性问题

2024年6月26日 · 378 字 · 2 分钟

在当今信息爆炸的时代,我们每天都在生成和消费海量的数据。对于依赖大量最新数据进行决策的领域,如金融分析、市场研究或实时新闻报道,传统的机器学习模型可能难以满足需求,因为它们通常在训练后便固定下来,难以适应快速变化的信息环境。近年来,Retrieval-Augmented Generation(RAG)模型因其结合了检索和生成的能力而受到关注。然而,RAG模型也面临着时效性问题。本文将探讨如何通过互联网检索和大型语言模型(LLM)来优化RAG模型的时效性。

重磅!ChatGPT团队官宣船新版本的多模态大模型GPT-4o,完全免费!

2024年5月15日 · 372 字 · 2 分钟

上周,有传言表示OpenAI即将发布AI加持的搜索引擎来增强聊天机器人的功能并开拓新市场,不过Altman否认了该传言,并提到“不是GPT-5,也不是搜索引擎,但我们一直在努力开发我们认为人们会喜欢的东西!”

5月13日,ChatGPT团队官宣了最新旗舰大模型GPT-4o,可以实时对音频、视频和文本进行处理,完全免费,果然是人们会喜欢的东西!

白嫖GPT4.0!

2024年4月30日 · 17 字 · 1 分钟

最近发现了一个宝藏网站,今天跟大家分享下如何白嫖GPT4,是真正的白嫖!完全免费,没有使用次数限制,而不是ChatGPT官网的每小时最多发送多少条消息。 本质是利用字节跳动开发的AI Agent平台Coze。本文使用coze.com作为演示如何白嫖GPT4.0。 使用教程 打开网页coze.com,点击Get Started登录或注册。

拥有你自己的Copilot!基于Llama3和CodeGPT部署本地Copilot,断网也能使用!

2024年4月25日 · 20 字 · 1 分钟

当谈到代码自动补全和辅助编程工具时,GitHub Copilot是一个备受推崇的选择。然而,有时我们可能希望在本地环境中构建一个类似的解决方案,以便更好地控制数据和隐私,更重要的是Llama3是免费,而Github Copilot是收费的。本文将分享如何基于Llama3这个强大的开源项目,搭建自己的本地Copilot。

如何用解决大模型时效性和准确性问题?RAG技术核心原理

2024年4月24日 · 37 字 · 1 分钟

在当今信息爆炸的时代,我们面临着海量数据的挑战。对于人们来说,从这些数据中检索到有用的信息变得越来越困难。为了解决这一问题,研究人员提出了一种新颖的技术,即RAG(Retrieval-Augmented Generation,检索增强生成)。

RAG结合了检索和生成的方法,使得从大规模数据中提取信息变得更加高效和准确。

本文将介绍RAG的定义、工作原理以及它所解决的问题。

超越GPT-3.5!Llama3个人电脑本地部署教程

2024年4月20日 · 193 字 · 1 分钟

4月18日,Meta在官方博客官宣了Llama3,标志着人工智能领域迈向了一个重要的飞跃。经过笔者的个人体验,Llama3 8B效果已经超越GPT-3.5,最为重要的是,Llama3是开源的,我们可以自己部署! 本文和大家分享一下如何在个人电脑上部署Llama3,拥有你自己的GPT-3.5+! 很多读者担心本地部署时个人电脑的硬件配置不够,实际上这种担心是多余的,笔者使用的是MacBook M2 Pro (2023款), 主要硬件配置如下:

Meta官宣Llama3:迄今为止最强大的开源大模型

2024年4月19日 · 111 字 · 1 分钟

4月18日,Meta在官方博客官宣了Llama3,标志着人工智能领域迈向了一个重要的飞跃。此版本具有经过预训练和指令微调的语言模型,具有 8B(80亿) 和 70B(700亿) 参数,可以支持广泛的用例。 Llama3在各种行业基准上展示了最先进的性能,并提供了新功能,包括改进的推理能力。

电话号码的字母组合

2024年4月18日 · 178 字 · 1 分钟

Question https://leetcode.cn/problems/letter-combinations-of-a-phone-number/description/?favorite=2cktkvj 给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。答案可以按 任意顺序 返回。