Agent的ReAct交互模式
论文地址:https://arxiv.org/abs/2210.03629 对应的 langchain prompt hub地址:https://smith.langchain.com/hub/langchain-ai/rea
agent会话中用户主动暂停消息的处理方案
背景: 在用户与 agent聊天的时候,用户可能主动暂停当前轮次的对话,然后重新向大模型发送消息。 用户暂停会话可能带来的风险:如果此时刚好 agent发送完工具调用的指令,工具未执行完成。那么在用户的下一轮对话时,因为未响应大模型的工具调用结果,可能导致大模型调用报错。
使用 claude api遇到的问题
## 背景 在使用 new-api 的转发服务时,报错: total_tokens = oai_token_usage.get("total_tokens", input_tokens + output_tokens) &n
一些开发中使用的 linux运维命令
查看目录下的文件或者文件夹大小 du -d 1 -h 杀死某些服务 pkill -f flask-search lsof -i :5000 | awk 'NR>1 {print $2}' | xargs kill -9
python包管理神器:UV
目前 UV 因其优势,已被大量的python开源项目使用。简单整理了一些命令,不到 UV 功能的 1/5,更多功能慢慢探索。 安装 # mac brew install uv # win powershell -c "irm https://astral.sh/uv/install.ps1 |
ollama-大模型的部署与使用
linux curl -fsSL https://ollama.com/install.sh | sh 因为安装过程有使用github相关资源,国内访问会有问题,需要加速。或者使用docker进行安装。各大云平台都有提供docker加速方法。 ollama的所有命令 Available Comman
为jupyter增加可选的python内核
在部分提供GPU资源的平台,进行使用的时候发现提供的jupyter的内核中,与命令行默认的外部的python环境不一致,且不能选择的情况。 以下是添加conda虚拟环境到jupyter中的方法 # 或者 source myenv/bin/activate conda activate myenv
Gemini 使用过程中的一些坑
使用限制 在使用 Gemini 的时候,谷歌限制了香港和大陆不能调用 API,可以考虑新加坡区域 转发服务 主要有 one-hub、One-api、new-api。在使用one-hub在One-api 的基础上进行了一些更新。(目前个人主力用的主要是one-hub) 出现的问题 1: 转发的时候发现
python中一些很好用的工具类模块
contextlib 此模块为 with 语句提供了一些工具,简化了 with的使用。 @contextlib.contextmanager 它将一个生成器函数转换为一个上下文管理器。而无需创建一个类或单独的 __enter__() 和 __e
常用的uml类图及其表示方法
介绍了常用的 7种类图