使用 claude api遇到的问题
## 背景 在使用 new-api 的转发服务时,报错: total_tokens = oai_token_usage.get("total_tokens", input_tokens + output_tokens) &n
一些开发中使用的 linux运维命令
查看目录下的文件或者文件夹大小 du -d 1 -h 杀死某些服务 pkill -f flask-search lsof -i :5000 | awk 'NR>1 {print $2}' | xargs kill -9
python包管理神器:UV
目前 UV 因其优势,已被大量的python开源项目使用。简单整理了一些命令,不到 UV 功能的 1/5,更多功能慢慢探索。 安装 # mac brew install uv # win powershell -c "irm https://astral.sh/uv/install.ps1 |
ollama-大模型的部署与使用
linux curl -fsSL https://ollama.com/install.sh | sh 因为安装过程有使用github相关资源,国内访问会有问题,需要加速。或者使用docker进行安装。各大云平台都有提供docker加速方法。 ollama的所有命令 Available Comman
为jupyter增加可选的python内核
在部分提供GPU资源的平台,进行使用的时候发现提供的jupyter的内核中,与命令行默认的外部的python环境不一致,且不能选择的情况。 以下是添加conda虚拟环境到jupyter中的方法 # 或者 source myenv/bin/activate conda activate myenv
Gemini 使用过程中的一些坑
使用限制 在使用 Gemini 的时候,谷歌限制了香港和大陆不能调用 API,可以考虑新加坡区域 转发服务 主要有 one-hub、One-api、new-api。在使用one-hub在One-api 的基础上进行了一些更新。(目前个人主力用的主要是one-hub) 出现的问题 1: 转发的时候发现
python中一些很好用的工具类模块
contextlib 此模块为 with 语句提供了一些工具,简化了 with的使用。 @contextlib.contextmanager 它将一个生成器函数转换为一个上下文管理器。而无需创建一个类或单独的 __enter__() 和 __e
常用的uml类图及其表示方法
介绍了常用的 7种类图
文本切分-语义分割(Semantic Chunking)
当我们使用固定长度的块大小或者一些标点符号分割文本时,其并没有考虑到块中内容的连贯性与完整性。我们可以借助 embedding 来来对文本中语义相近的句子进行聚类。 可以考虑的方法包括: 层次聚类与位置奖励:如果只使用层次聚类 (逐个的将所有句子进行聚类),当一个长句之后存在一个短句时,会存在一些问
dify 并发 及配置优化
以 docker compose 部署为例,以下是一些常用的参数优化(修改后注意观察服务器负载): 数据库连接数 当把工作流发布为工具,进行并发调用时,容易导致数据库连接失败。 # 配置文件路径:docker/.env # 每个 dify服务进程的数据库链接池数量 SQLALCHEMY_POOL_S