首页
常用运维脚本汇总
电子书阅读
Search
1
安装docker时报错container-selinux >= 2:2.74
172 阅读
2
rsync命令(可替代rm删除巨量文件)
141 阅读
3
docker 镜像加速器配置,daemon.json文件详解
133 阅读
4
使用国内镜像地址拉取k8s安装需要的images
94 阅读
5
docker search命令提示i/o timeout的解决方案
93 阅读
运维
自动化运维
数据库
容器与k8s
环境
云计算
脚本
ai
登录
Search
标签搜索
命令
nginx
zabbix
Mingrui
累计撰写
92
篇文章
累计收到
8
条评论
首页
栏目
运维
自动化运维
数据库
容器与k8s
环境
云计算
脚本
ai
页面
常用运维脚本汇总
电子书阅读
搜索到
2
篇与
的结果
2025-10-26
ai模型使用的两个建议
随着对话的深入,对话内容会自然增长。建议切换话题时始终新建对话。新建对话时,相当于清空上下文窗口并重置分词计数。若现有分词对后续查询不再有用,建议重置。因为维护这些分词的代价很高。这种代价主要体现在以下两个方面:大量分词,可能导致模型注意力分散。这些前置的分词,相当于模型的工作记忆。当分词过多时,模型可能会被历史标记分散注意力,特别是在后续需要采样标记时。当注意力被分散时,会降低模型的准确性和表现。上下文窗口中的标记越多,计算成本就会越大。虽然这个计算成本的增幅程度很低,但仍会影响生成序列中下一个标记的生成速度。因此模型速度实际上会轻微下降。计算下一个标记的成本变高。且标记数量越多,事实上,可以把上下文窗口中的标记当做珍贵资源。这相当于模型的工作内存。因此不要用无关信息过度加载,尽量保持简洁。这样模型运行的会更快更好。务必注意,当前使用的具体模型版本。大模型的计算成本更高,因此提供方会对大模型收取的费用也更高。请根据自身的大语言模型使用需求权衡利弊,评估是否可以使用更经济的方案。如果基础模型的智能程度不够,而你又是专业用途,就应该考虑购买顶级模型。
2025年10月26日
35 阅读
0 评论
1 点赞
2025-10-26
提升ai回答多样性的提示词
中文版你是一个多样化生成的助手。请按照如下要求输出:生成 5 个不同的候选答案(内容尽量有风格差异)。为每个答案给出 0-1 概率,并保证总和为 1。按概率从高到低排序,逐条输出为:内容|概率。在末尾给出“采样建议”:若只需 1 个答案,推荐选择概率最高者;若需多样性,可按概率加权进行随机采样。英文版You are a helpful assistant. For each query, please generate a set of five possible responses, each within a separate <response> tag. Responses should each include a <text> and a numeric <probability>. Please sample at random from the [full distribution / tails of the distribution, such that the probability of each response is less than 0.10].
2025年10月26日
16 阅读
0 评论
0 点赞