日报 on Hardy Blog

2026.6.9

Tue, 09 Jun 2026 00:00:00 +0000

FastAPI内置Swagger（交互式API文档），编写API接口文档与调试接口非常简单
Spotify是一个免费的音乐播放器，但是不时需要观看广告。它有一个缺点是没有桌面歌词，一个应用可以解决这个问题，它是Lyricify，登录你的Spotify账号，注意它只是一个显示桌面歌词应用，没有音乐播放的功能。使用它，需要你在Spotify播放音乐的同时，打开Lyricify，然后它会自动识别。
lint，静态代码分析，判断你的代码在运行之前有没有风险；build，是编译你的代码能不能通过是你部署你项目的前提；
CI（Continuous Integration）持续集成，指的是将代码提交后，持续对所提交的代码进行的检测，然后判断是否可以合并到主分支中。CodeRabbit，就是其中的一个例子，在将你的项目install该CodeRabbit后，它会自动的对PR进行AI分析，并且评论到该PR的下方，对与public的仓库它这个功能是免费的，对于private仓库，它的每月大约有300次的免费额度。
LangGraph是编排框架，基于图的方式编排LLM应用节点，这样方便后面的功能节点的增加；LangFuse与LangSmith是观测平台，他们功能是将每一次的调用的流程可视化，其中LangFuse是开源的项目，方便自己项目从头到尾自己管理；LangSmith与LangChain集成更好。
windsurf被Cognition收购后，将其名字修改为Devin

2026.6.6

Sat, 06 Jun 2026 00:00:00 +0000

现在agent开发的主流技术栈是：fastAPI写后端接口，next.js写前端UI，Langraph为编排框架，Langchain作为RAG组件库，milvus作为向量数据库，postgreSQL作为关系型数据库，MCP作为工具调用协议。
为了提高向量的检索效率，向量数据库中还会存储元数据。在进行向量相似度的匹配之前，首先通过元数据筛选，缩小匹配范围，提升检索速度。
python的类继承是通过“（父类）”来实现的，在括号中写明要继承的类。
目标，先做一个自己的agent，跑起来，然后再做一个检测web，再往多agent靠。
稀疏向量与稠密向量，稀疏向量中的绝大多数值都是0，并且向量中的每个值与词存在对应关系；而稠密向量中绝大多数的值都是非0（小数），一般用来“词汇”精确查询，但是没有语义识别能力，不能判断同义词；稠密向量中的值大部分没有意义，它只能整体来看其在向量空间的位置与哪些向量靠的距离比较近（一般语义相似），因此可以进行语义识别，但是不能精确识别。在实际的运行中一般结合这两种方式，即混合检索。
RAG流程分两步，离线将文档切块、嵌入、建索引存入向量库；在线将用户问题向量化后检索相关片段，连同问题一起交给LLM生成答案。

2026.6.2

Tue, 02 Jun 2026 00:00:00 +0000

因为现实世界中的信息是多元化的，不仅有文本，还有图像、音频、视频等，对多模态嵌入模型要求变得更高了，所谓的多模态嵌入模型就是将不同的信息源并入同一个向量空间，表达相似信息的信息源其向量非常接近。
openAI的CLIP多模态嵌入模型是一个非常有影响力的模型，该模型的能力是建立在其进行了大量的图文对比的训练上的。
huggingFace是一个拥有丰富模型的hub平台，用户可以在这里调用下载开源的模型
pip install -e . 命令的作用是将本地的代码当成依赖下载，其它代码便可以调用，前提是你的项目目录下存在一个 setup.py 文件（传统方式）或 pyproject.toml 文件（现代方式，常与 setuptools 结合使用）。这个文件定义了包的名称、版本、依赖等信息。其中 -e是editable，其作用是建一个指向你当前项目目录的链接。所以，你对源代码做的任何修改都会立即生效，无需重新安装。
Pytorch是一个深度学习的框架
with 是 Python 中一个非常重要的语法，叫做上下文管理器。它的核心作用是自动管理资源，确保资源在使用后被正确释放，无论中间是否发生错误。

2026.6.1

Mon, 01 Jun 2026 00:00:00 +0000

上周没有更新是因为在处理实习辞职的事情，在周三的时候处理完之后就直接休息了一周，报复性休息，疯狂的玩游戏、吃不干净的食物、作息稍有混乱。以结果来看，没有休息好，反而有点累。因为上周打羽毛球，把腿伤到了，这周没有健身，也算是找了一个合适的理由。现在对这2个半月的实习做一个小总结吧：
1. 为什么辞职？
  - 因为要期末考试了，要准备一下
  - 项目完成，工作内容减少、重复、简单，对自己没有提升
  - 与期望目标岗位或工作内容不一致，我想要往agent开发转
  - 薪资想要进一步提升
2. 其实这两个月技术上没有很大的进步，最主要是提升自己的见识了，当然这个是不同方面的。如公司内部是具体是怎么运行的，工资是怎么发的，处理同事关系，看一下别人是怎么使用各种ai工具的等等。
3. 当然还是掌握了一些专业知识的，比如对guthub的理解更加深刻，docker容器的使用，项目在云端服务器的部署，数据库存储过程等，ai工具在工作中的使用、办公软件飞书的使用等
4. 当然最主要的是让我体会到了赚钱的不容易，我不想也不会过一辈子这样的为一日三餐奔走的生活，我开始了我的理财之路，希望有朝一日会尽快实现财富自由。
5. 谈一下我对AI发展的看法吧，我其实对现在的两种主流的看法都赞同，一种是不再需要手写代码，以结果为导向，功能没问题就可以（这里的侧重点是测试，大家以后都变成了测试工程师）；还有一种是对“彻底的AI开发”持反对意见，强调工程师还是要懂得代码的，要知道AI写了什么，与我们的期望一不一致，工程师要对自己提交的代码负责。对于第一种，现在有种反对意见是完全AI开发应用虽然看起来功能齐全，但是存在大量且严重的安全bug，甚至有大量的用户数据在互联网信息传递的过程中被泄露。
Doker Desktop在windows使用的时候需要启用WSL（Windows SubSystem for Linux），原因是因为绝大多数的容器镜像都是为Linux环境设计的，因此Docker需要一个Linux环境来运行这些镜像。
AMD 64架构又叫 x64，与ARM64架构有区别
所得等级攀升，指的是在通货膨胀的影响下，你名义的工资收入变多了，你成功进入了更高税收层次等级，但是你的实际购买力没有增加，结果交的更多了，到手的反而更少了。
解字计划（jiezi）免费送大学生token，名额有限，可以了解一下：https://github.com/jiezi-ai/grant
SOCKS5是一个会话层转发请求到代理的协议；HTTPS是HTTP + TLS/SSL加密层，主要用于保护客户端与目标网站服务器之间的直接通信，防止数据在这个环节被窃听或篡改

2026.5.22

Fri, 22 May 2026 00:00:00 +0000

《穷爸爸富爸爸》图书火了以后，作者又出版了很多“富爸爸”系列的图书，如：《富人如何变富》，该作者还成了一个财商教育公司“富爸爸公司—The Rich Dad Company”。
道琼斯工业指数是美国传统行业(金融、工业)的龙头企业股票的集合，涵盖面非常窄，反映大型传统蓝筹股(蓝筹股是具有稳定的盈余记录，能定期分派较优厚的股息，业绩优良的公司的普通股票，也被称为"绩优股"。它们是投资者投资的安全和可靠的选择，因为它们的价格相对稳定，收益也比较可靠。)；而标普500指的是美国各行各业代表性企业股票的合集，涵盖面非常广，可以反应美国经济的变化；纳斯达克100指的是在纳斯达克上市的top100创新科技能力最强企业的股票集合。
“高位钝化”是指技术指标（MACD、RSI等）在高位失去了参考意义（变得迟钝），通常暗示动能衰竭、面临回调。
杀跌指的是股票在下跌的时候，大家因为恐慌情绪纷纷抛出股票导致股价下降势头越来越迅猛。
腾讯马维斯（Marvis）上线了，号称是操作系统级别的ai助手，其实体验下来没有太多惊艳的地方，与主流的Codex与CLaude Code并没有很大的区别。唯一让我比较感兴趣的是手机端可以指挥桌面端干活，codex也有与好像是与chatGPT搭配。
恒生科技指数，号称“港版纳斯达克”。聚焦头部的30家头部港股上市的科技公司（腾讯、阿里、美团、小米、中芯国际、理想汽车），2026年6月纳入智谱、MINIMAX（AI新贵），但是最近股价在下降。

2026.5.20

Wed, 20 May 2026 00:00:00 +0000

纳斯达克是美国的一个证券交易所，很多科技巨头在这里上市，如拼多多，京东，百度等中概股（中国公司，但是在美国上市）。是全球科技创新的代名词。我们常说等我买纳斯达克的意思其实是买纳斯达克100指数的基金，从纳斯达克市场中挑选出100个最大的科技公司。国内无法直接购买美股股票，但是可以通过购买QDII（Qualified Domestic Institution Investor，合格境内机构投资者）基金，对应的基金公司会那拿着我们的人民币，兑换成美元后，去买纳斯达克100，然后在纳斯达克市场获利后，将美元兑换成人民币，然后把你对应的获利分配给你。为什么建议定投纳斯达克，是因为纳斯达克代表着全球科技巨头，非常具有潜力，虽然短期内会有波动，但长期来是呈现上升趋势的。
标普500与纳斯达克100的区别是，标普500涵盖美国各行业500个企业，代表美国整体股价的变化，纳斯达克是科技巨头的股价变化。
利空是不好的消息容易导致股票下降，利好是好消息，容易导致股票上升。
套牢的意思是，你买的入的看好的股票一直在降价，亏损了不舍得买，被困住了。
三板市场指的是的地方，一板市场是沪深主板，二板市场是创业板（成长型公司）
MACD指数是看这只股票涨与跌的动能强弱，用来辅助看股票涨跌，找到买卖点。最好搭配其它指数一起。

2026.5.19

Tue, 19 May 2026 00:00:00 +0000

飞书机器人与飞书应用都可以通过webhook响应外部触发，只不过侧重点不一样。例如指定机器人在特定情况回复指定的信息。
A股普通股票的最小单位为股，想要买入，最少买1手=100股，卖出可零散股。今天下午沪深300ETF回涨。
长江存储与长鑫存储是国内存储芯片的巨头，分别在外存（NAND闪存）与内存芯片（DRAM）上实力强劲，两家公司近期准备上市。
飞书表格与md格式的表格不一致，可以通过飞书提供专门的api来获取。
一般RAG固定大小分块的实际流程是这样的，首先统一规格化，将多余的\r，空白字符，特殊控制符去掉；从本文的开头开始，按照ChuckSize大小进确定TargetEnd，为了保证语义，会进行边界划分，在overlapSize的范围内，对分界线回退，按照标准的优先级确定新的分界点，如果没有合适的分界点，会使用TargetEnd。然后将这些分好块的加入chucklist等待向量化。
三大运营商利用自己强大的基础设施，退出来token套餐服务，一定程度上促进了股票的上涨。但是因为套餐模型来质量不确定、价格较高对于c端的吸引力不强，可能会转向B端发展。

2026.5.18

Mon, 18 May 2026 00:00:00 +0000

MIME (Multipurpose Internet Mail Extensions )，多用途网络邮件扩展，最初是邮件扩展，现在的作用是在网络中标识文件/资源的媒体类型（content-Type）不只是邮件，如pdf，word，docx等。
cline使用的时候需要自己配置一些信息，mimo API模型的上下文窗口为1百万，1M=1000k，需要注意的是在codex中plus版的context大小为254k。使用api调用上下文大小同样支持100万。
温度temperature影响模型稳定性，其值在0-1之间，越接近0越稳定与，每次问同样的问题，ai回答是稳定的，越接近1，在同样的情况下，ai的回答越富有变化，具有创造性，可以根据不同的需求来调整该值。
股票开户后需要在下一个交易日，才能买卖股票。
rag系统的一般流程是：读取文件字节流-获取文件原始数据-切块-语义增强-向量化-存入向量数据库
《太白金星有点烦》

我在此之前没有看过西游记的原著，只零星看过86版的电视剧。在此默认电视剧与原著所讲故事情节一致，而这本书圆满到，足以让我认为西游记背后就是如此。小时候只当这是一个普普通通的故事来看，想不到这其中还埋藏着这么多的弯弯绕绕。我经常都长篇小说500万字左右的故事，因此当我读完了这篇只有13万字的短片小说，感觉意犹未尽，但是短短13万字却比很多长篇大论的小说要讲的清晰。读完这本书，最大的收获是我们平时一定要尝尝思考，当然利己主义未必不可取。

2026.5.17

Sun, 17 May 2026 00:00:00 +0000

想要将你知识库中的飞书文档导出来，需要在飞书开发平台创建一个应用然后赋予其相应的权限以及机器人功能。在飞书群中建立一个群聊，然后将该机器人加入到群聊中。随后再将你要导出的飞书知识库的管理成员中添加该机器人所在的群聊。随后可以通过该应用调用飞书相关的api，以此来导出对应的文档。飞书提供可以导出pdf md word等格式的api。
SSE是基于http协议实现长连接，服务端单向推送，是服务器与客户端长时间建立连接，服务端向客户端持续发送消息，直到消息发送完毕。HTTP是短连接，单次请求响应。webSocket是全双工双向长连接。
cursor可以自己配置第三方的api来使用，但是有一个缺点是agent每月有使用次数的限制，大约在15次左右。
使用了这么久的ClaudeCode IDE插件的感触是只会执行任务不会总结，每次执行完不知道它是怎么操作的，与codex有明显的差距。可以试一下装一个让其每次执行完任务总结的skill来试一下。
证券公司开户，在提供了一些列的证明材料后，需要一个工作日的时间来进行审核。
余额宝的利率不是固定的，会随着整体市场利率而调整。

2026.5.15

Sat, 16 May 2026 00:00:00 +0000

苹果移动设备codex土区充值流程，注册苹果账号->购买一个礼品卡兑换码->更换苹果移动设备的地址为土耳->在苹果商店中兑换礼品卡->下载chatgpt移动端->登录你的账号->升级plus在缴费的时候可以使用积分购买。

注意苹果账号如果刚刚注册，最好等一天，在使用礼品卡不然充不上，不然你的账号会出发苹果账号的风控，导致余额冻结。
对象存储系统，与传统的文件存储系统不一致，没有层次结构。只有每个存储对象具有一个唯一的key标识，每个对象对象之间没有复杂的关系。在对象存储系统中，顶级的存储概念叫“桶”（bucket），对象存储在桶中。MinIO是一个比较有名的对象存储系统。
敏感信息（邮箱、密钥、密码）需存储在仓库 Settings → Secrets and variables → Actions（仓库级Secrets）中；核心逻辑：Secrets加密存储、代码中不可明文查看，Workflow可通过环境变量调用，避免私有信息硬编码暴露在代码里。
github的actions功能是提供自动化，让你的项目自己执行一些动作，但是需要在仓库.github/workflows/目录下创建YAML格式的WorkFlow文件，来说明你的自动化任务，触发条件等。
简历投官网竞争比较激烈（很多大佬），简历容易被刷，如果有内推码尽量使用内推码，
codex的skill的组成：agent文件里面放置着codex的UI如何展示该skill，scripts脚本文件，reference文件描述如何执行该skill（需要注意什么），SKILL.md文件，最主要的文件该文件是必须的，描述skill是做什么。

2026.5.14

Thu, 14 May 2026 00:00:00 +0000

一般提供使用java编写项目的部署服务，都会需要先绑定一个visa卡（visa是一个国际银行卡清算组织）
github提供pages功能，可以方便的将自己github的一些静态网页资源部署，并且通过action 部署，来启动自动化部署（一旦github仓库修改就会自动开启部署）
hugo是一个使用go语言编写的高性能静态网站生成器的服务，比较快速。hugo book是hugo的一种mode，其网站的布局非常简洁，是现代常见的一种网页布局，左侧是菜单项与搜索栏。
deepseekTUI（Text-based User Interface，文本用户界面）是一款针对于deepseek模型的CLI agent，CLI具有比较友好的界面。
codex土区充值（土耳其），一些落后地区购买同一订阅所需金额较少，因此有些人通过一些手段来赚取中间价。
传统RAG技术存在每次检索拼接上下文消耗大量token，理解慢，成本高。RAG开发者研究出一种新的技术（newql），通过提前编译知识库，结构化预处理，减少运行时消耗动态token量，提升推理速度，降低成本。

2026.5.13

Wed, 13 May 2026 00:00:00 +0000

cloudflare（主要免费部署产品是 Cloudflare Pages 和 Workers）与render，都可以免费部署项目，但是前者的缺点是不可以部署java项目，后者可以通过docker部署java项目（需要新增一个dockerFile文件来说明），部署完后如果guthub又有新的提交后项目会自动重新更新，但是免费版在请求的时候有速度限制，尤其是项目冷却后重新加载时非常慢。
rocketMQ，阿里开发的用来处理高并发请求的中间件。
minIO（RustFS）是开源的对象存储系统，完全兼容AWS的s3协议。
Claude IDE插件可以通过设置，开启最高权限，是claude在工作的时候不用每次都询问用户是否同意操作，浪费时间。设置选项为：Allow Dangerously Skip Permissions 。
李代桃僵的意思是另外的人来代替原本该受处罚的人处罚，带人受过，投桃报李，意思是一个人给予了另一个人好处，这个人做出相应的回报
飞书的知识库不能直接导出，如果想要导出，通过飞书开放平台创建自建应用，申请 wiki:document:readonly 等权限，然后调用 API 批量导出。

2026.5.11

Tue, 12 May 2026 00:00:00 +0000

Qt框架是用c语言编写的，是一个功能很多图形界面框架。
上证指数，深证成指与创业板指，这三个指数是对A股的不同纬度方向的涨跌展示，其中上证指数指的是上海证券交易所股票的总体涨跌，深证成指，指的是深圳证券交易所的500只代表性大盘股涨跌情况，创业板指大多是科创，成长型企业。
IPO（Initial Public Offering）首次公开募资，等同于上市。
买的股票降价了，但是你还没有卖出去，没有产生实际的亏损，叫做浮亏。
余额宝只有在自己转入余额宝中的余额被确定的时候，才会开始产生利息。余额宝其实是一个货币基金产品，之所以会给你利息，是因为他把大家的钱去做银行存款、短期国债登低风险投资去赚钱，从而把转到钱的一部分给大家，以此来支付给用户利息。
沪深300ETF（exchange traded fund），是一种交易指数基金，买一份相当于买了很多的上市公司的股票。

2026.5.12

Tue, 12 May 2026 00:00:00 +0000

S3指的是Amazon sample storage service objection，与阿里云的OSS（objection storage service）一样，都是云对象存储服务。与网盘（文件存储）不一样的是，S3存储是以对象的形式存在，并且提供了标准的http与https访问路径。文件存储存在层级结构（文件夹），但是对象存储没有，它是一个超大的存储柜，每个文件都是是一个独立的对象，存在唯一的key（文件名）。
女娲skill，可以通过这个skill来简易的蒸馏一个其它skill。
npx命令是临时把远程npm官方仓库中的包下载到本地使用一下，使用完就就会自动删除缓存，不会污染本地环境。当然它会先检查本地中有没有，没有它就会使用远程的。例如，npx skill（s） add “skill路径（比如你的github上skill所在的仓库）”
github仓库不能使用中文命名
bitget会检查你的ip地址，部分地区不提供服务
通过蒸馏出来的skill，给不同的agent应用上，其回答问题的风格非常像被蒸馏的人，借此可以搭建一个聊天软件，只不过这个聊天软件中的人都是带有不同skill的agent，可以单独聊也可以建立一个群聊。

2026.5.8

Sat, 09 May 2026 00:00:00 +0000

github发布release的过程，进入你的仓库项目，新建一个release，进入新建release的界面，选择一个tag（一般是版本号如v0.1.0，没有就新创建一个），然后填写release note更新说明，以及release title，然后上传项目打包好的exe、SetUp等可执行安装包。我的项目是通过npm run pack 等脚本命令建立的setup可执行文件，打包产物作为附件上传。
transformer框架的自注意机制的发明，解决了为大模型的发展瓶颈，以前是静态词向量/静态上下文，每个词的意思都是固定的，比如苹果理解为水果苹果的话，苹果公司就会被理解为水果苹果公司。所谓的自注意机制，就是使得大模型具有了可以根据上下文来推断某个词的语义的能力（动态上下文）。苹果好吃，这里的苹果是水果，苹果公司在这种情况下就会被理解为著名的苹果公司。
多模态模型发展的必要性。为了使得大模型能统一理解文字、图片、视频等信息，引入了多模态模型，其实它们是一种嵌入模型，将上面的信息变成同一纬度的的向量存入向量数据库中，根据向量相似度匹配判断跨模态语义关联，比如“一个可爱的狗”的文字与一张描述“一个可爱狗”的图片，两者生成得向量空间距离很近，语义相似度极高。
嵌入模型的训练方式，对比学习训练，掩码预学习训练，多模态对齐预训练。
对了切片方式除了固定字符切片，递归字符切片与语义切片还有向量聚类切片。语义切片是在语义跳跃点（根据向量距离来判断，距离越近语义越接近，越远越语义越不接近，在语义距离大于一定距离处即语义跳跃点）处进行切片；而向量聚类切片的意思是，先把所有的文本片段全部转化为向量，然后进行一次全局的向量相似比较，用聚类算法自动把语义接近聚成一类，每一类就是一个分片。
语义跳跃的意思是两个向量之间的相似度十分弱，也就是语义不接近，产生语义跳跃，适合作为切点。

2026.5.9

Sat, 09 May 2026 00:00:00 +0000

微软提供了一个Windows UI Annotation，微软内置的系统辅助功能API，允许程序读取系统上的任何UI元素文本，包括浏览器网页。我们可以通过这个api来使得我们的程序可以读取用户正在浏览的网页的内容。
文本分块还有一个策略是基于文本结构的分块，将机构化的文档如md文档，按照已有的结构进行分片，如按照一级标题分片；但是这里村存在一个问题是，有些部分的内容过长可能会导致，分片后长度仍然超出目标chunkSize，还需要再分片。
小米mimo模型不同套餐的baseURL的地址不一样，需要注意一下。
丰富giuhub的个人简介部分是通过创建一个同名仓库，然后再在该仓库的下面创建一个readme文件，然后这个文件的内容就会展示在个人profile上方区域。

2026.5.7

Thu, 07 May 2026 00:00:00 +0000

codex登录新增手机号验证，可能是为了防止批量注册账号来嫖取免费额度。+86大陆手机号目前不支持被检测，会报错。
codex的插件-HyperFrames，可以通过它来制作视频。其原理是把HTML+JS+CSS网页制成mp4格式的视频。
RAG在垂直领域的应用已经落后了，依靠向量相似度进行匹配，一定会存在语义模糊的情况。KAG技术（Knowledge-Augment-Generation）知识图谱（结构化数据）+向量检索双重引擎，在专业垂直领域比RAG强。
api中转站-rkapi，可以在ccswitch中配置中转站兼容chatgpt等模型提供方的url与apikey，来调claude与chatpgt官方模型，没有plan计划，按调用token量计费。

2026.5.6

Wed, 06 May 2026 00:00:00 +0000

windsurf的对话记录的存储格式为pb（protocol buffer 一种二进制数据交换格式，跨语言平台）数据文件，不能直接读取。必须要有windsurf的proto定义，才能反序列化解析。
langchain存在三种分片策略，固定字符分片，递归字符分片以及语义分片。其中langchain的固定字符分片，是指先，按照制定分隔符（比如换行）直接分片，当分片大小小于chunkSize时，直接将该切片当做一个chunk，继续下一个段落分片的判断。当分片的大小大于chunkSize的时候，会直接将大于chunkSize的那些字符丢失，然后当做一个chunk，还有一点是为了不丢失语义，它有在不同切片之间存在overlapSize大小的可重叠字符；下一个是递归字符分片，它会在一个字符列表中遍历首先使用优先级最高的字符，当字符列表中的字符可以分片，就选择这个字符首先进行分片，一般这个字符切出来切片会有大于chunkSize的切片存在，那就对这个切片继续进行下一等级的字符进行切片，直至大小合适；还有一个是语义切片，依赖Embedding模型，按照语义切分，语义完整性最好，但是开销最大。
我的项目中的阈值的意思是当上下文token量达到规定token量的百分比的时候自动执行一次上下文总结。
web3指的是web发展的第三阶段，我理解的不同阶段是指的数据而言，web1阶段用户只能看静态网页，不产生数据；web2阶段也就是现在的大部分网页，用户在web上的行为可以产生数据，但是数据的所有方归该网站的所有者；web3则是自己的数据归自己。web3钱包就是指，用户自己管理自己的资金数据，而不依托于第三方平台。bitget是一个虚拟货币交易平台，在这里可以使用web3钱包，或者它自己的资金平台进行交易。

2026.5.2

Sat, 02 May 2026 00:00:00 +0000

base64，可以将一些二进制数据（图片，视频等）转成dataURL编码字符串，方便存储与获取。
claudeCode的官方原生服务一般需要账号登录后才可以使用，不管是ClaudeCode CLI，IDE插件还是desktop。CLI与IDE插件可以通过CCSwitch来使用第三方的API服务，来绕过登录，直接使用claude code。而desktop可以通过启动它的开发者模式来使用cowork配置第三方api服务，进而可以绕过它的登录校验。
curl是一个可以向发送api/网络请求的工具，兼容很多协议如http，https，ftp等

2026.4.30

Thu, 30 Apr 2026 00:00:00 +0000

今天想了一个项目context-bridge项目。
Tailwind css是一个原子化css框架，内置预设样式类名，通过在元素的class属性中添加相应名称，从而给该元素添加对应的css样式效果。
next.js是一个可以通过一个js或ts语言来编写前后端的react全栈框架。
Electron是一个跨端桌面客户端开发框架通过js语言来编写，可以将web应用打包成windows或者mac桌面客户端。
python语言中，函数末尾的->是非必须的，用于提高代码可读性以及方便静态检查，在编译后会被忽略，与ts中的：如出一辙。
所谓skill，就是给大模型回答的时候设定一个规则，让其按照这个规则来回答、解决问题。
所谓MCP（model context protocol）是给大模型的一个接口，让其拥有接入外部工具的能力，比如playweight，就是让大模型拥有自己浏览网页的能力。

2026.4.29

Wed, 29 Apr 2026 00:00:00 +0000

langchain中的两个template：普通模板与fewshot模板都有invoke与format方法（继承自父亲）。其中invoke方法的能力比format方法强一点，其返回的类型不是字符串，而经过format处理后返回的是字符串。invoke的返回值可以用于chain。
小米的百亿token计划已通过，在自己申请计划的邮箱所绑定的账号，下发了standard套餐（1个月-1亿token），自己在ccswitch配置了兼容Anthropic接口xiaomi模型的快捷切换方式，使用了该套餐专属的apikey以及baseurl，使用的是mimo-v2.5 pro，感觉比较不错。现在在使用windsurf的claudecode插件来调用该模型，因为在ccswitch中设置了，直接切换即可。
下载使用opencode，来调用xiaomiMimo模型感觉极差。它这个软件编排架构极差，因为问一个简单的问题回答的速度都很慢。
使用谷歌的ai agent -Antigravity（“反重力”名字感觉感觉有点意思）里面可以使用gimini模型，但是这个软件对地区的限制比较多，自己一直登不上自google账号，因此放弃使用该agent。
claudecode-learn的github项目（简单介绍如何快速搭建一个类似于claudecode的外壳）自己又过了一遍chapter1，其主要的思想是，一个循环一个bash就是一个agent。具体的流程是这样的，用户提问，进入循环调用模型，直到系统不调用tool时才退出循环，否则继续执行循环调用tool，并且将调用的tool返回的结果，加入到新的用户提问中，继续调用大模型，重复以上的过程，直到不调用tool。
粤语中以h开头的音节，通常都不发h声母。

2026.4.28

Tue, 28 Apr 2026 00:00:00 +0000

langchain大模型开发，嵌入式模型的调用使用embed（将分片数据转成向量数据并存入向量数据库中）与llm、chat模型使用的stream、invoke不一样。
CCSwitch是一个方便agent更换所调用模型的应用（只需要你选择你agent对应的模型供应商，可以选择官方可以选择第三方的供应商，然后需要你提供的只有apikey）
小米mimo模型，现在有一个百亿级token计划，需要自己申请（官方会根据自己的条件进行筛选）。Mimo-v2的模型能力比肩deepseek-v4，甚至超越，属于第一梯队开源大模型。
transformer是大语言模型的核心基础框架构，属于深度学习神经网络架构，如opus，chatgpt等主流模型均基于transformer的编码器，解码器结构迭代开发。
uv、venv、conda在创建虚拟环境上的区别，uv比较快速（新一代技术适合纯python项目），venv适合快速上手，conda可以创建如python，c++等语言的虚拟环境，适合大型科学数据分析项目。

2026.4.27

Mon, 27 Apr 2026 00:00:00 +0000

RAG主要的用处是建立企业内部的知识问答库，安全，但是为什么不能用那些agent呢？我能想到的一点是快而且花费低。RAG的一大缺点是，回复存在偏差，因为其在存储的时候是分片存储的，因此可能会将一段话拆片存储，导致语义缺失，因此查询出来的信息可能是存在错误的。但是相较下，agent因为react范式的存在，它会循环多次，使回答的更准确，但是它也因此满并且token花费多。
github的codespace与腾讯的cloudcode，是指在云上的编辑器，一切在云上，终端是linux命令。
codex的自动化任务是本地化的，不会云端同步，即同一个账号的自动化任务，在不同的设备上不一致。所谓的自动化任务，就是定时自动发给codex一个固定的命令让其执行。
linux的命令：vim 编辑，输入i进入编辑模式，按Esc退出，进入命令模式，输入：wq保存并退出，：！强制退出不保存

2026.4.25

Sat, 25 Apr 2026 00:00:00 +0000

agent开发，一般指两个方面的开发：一种是指对大模型进行开发；另一种是harness开发,指可以辅助大模型完成任务的工具的开发（大部分agent开发指的是这个）。

2026.4.20

Fri, 24 Apr 2026 00:00:00 +0000

java“是一次编写，处处运行”，是得益于它的JVM虚拟机，java为不同的操作系统编写了不同的jvm，同一份字节码在不同的平台上运行的结果一致。
可以使用本地的数据库可视化工具，连接docker容器中的mysql、redis等。需要注意的是连接的端口是宿主机映射端口。
JIT（just in time）即时编译技术，先将原本的java代码编译成字节码（.class文件），然后字节码需要在jvm中解释成机器码，这是一般的运行过程。而JIT会将hot spot代码解释成机器码后缓存（常驻内存），下一次需要用到这个代码直接使用即可。随着编译次数的增多，这里的热点代码会逐渐精确，从而出现越运行越快速的现象。
Oracle JDK 闭源商业版，OpenJDK 官方开源版。

2026.4.21

Fri, 24 Apr 2026 00:00:00 +0000

布尔值，虽然一个bit即可表示，但仍会占用1个字节，8个bit，大大浪费了空间。用整数(int/long)的每一个二进制位(bit) 分别代表一个布尔状态，用二进制位掩码+位运算，把多个布尔压缩进一个整数里，»只是用来定位某一位的工具
shardingSphere是aphache下的分布式数据库中间件，其主要的作用是让应用层的sql可以在经过分库分表后仍然可以正常使用，不必因为分库分表的原因而改动sql语句。原理是它会把你原本的sql语句变成SQL解析、路由到对应库表、改写执行、最后合并结果。
分库分表即横向扩展数据库，相比于纵向提升单机硬件，横向扩展更加灵活。其出现的背景是，随着数据库的使用，一张表的记录数量可能会越来越多，在每次查询同一条记录的时间会变长，单表数据量过大时，原因是索引树高度增加、IO开销变大、单机性能瓶颈导致查询变慢，而非索引本身问题。所以这时可以采取分库分表策略。比如对于一张table的一个数值字段对2取余，值为0记录的存在schem0中，值为1的记录存在schema2中。这样可以缓解服务器的压力，提高sql执行速度。
在mysql数据库中root用户创建的数据库，表等默认情况下其它用户是不可见的，除非root用户给予权限。

2026.4.24

Fri, 24 Apr 2026 00:00:00 +0000

为了开发，langchain提供了官方python SDK，直接使用pip即可安装，然后即可进行python代码的开发，快速进行大模型相关开发
再进行RAG开发的时候，主要会遇到三类模型：LLM，聊天模型以及embedding（嵌入）模型，其中LLM是基底（根据用户的问题，回复最可能的文本回答，无上下文记忆），而聊天模型是在其基础，天然支持多轮对话与上下文记忆（豆包，qwen等）；嵌入模型主要用在将非结构化的数据转为高密度向量存入向量数据库中，方便计算机理解与操作。
rebase操作，首先会将还未与远程分支合并的提交暂存，然后将远程分支的修改拉去到本地，然后将暂存的修改取出，生成一个新的提交（即使代码更改与原来的更改一模一样）。rebase操作可能会出现冲突，这时候git rebase操作会中止，解决完冲突后，git add .使git知道冲突已解决，然后使用git rebase -continue，继续合并下一个提交，因为rebase 操作时可能会有很多的提交。如果需要中止rebase 执行git rebase –abort
api代理的使用主体是客户端，api反向代理得使用主体是服务器。api代理，是指将客户端的请求不能达到目标服务器，通过代理服务器的中转发给目标服务器，这会隐藏客户端的ip地址，主要应用如VPN；api反向代理指的是，服务端为了隐藏自己的ip地址或者为了解决跨域的问题或者分流的问题，使用了一个中间服务器，使客户端不再直接服务器发送请求，而是通过请求中间服务器，使其将请求发送到目标服务器，此外这个还可以实现负载均衡：目标服务器一般会存在多个，中间服务器这个时候会通过根据多个因素算法计算将请求发送给合适的目标服务器。
使用VPN时流量的转发途径：自己设备-隧道加密-内网网关（学校/公司网关）-国内运营商-vpn节点服务器-请求目标网址的服务器
api中转站：请求-中转站（具有自己的网址）-目标服务商

2026.4.23

Thu, 23 Apr 2026 00:00:00 +0000

langchain是开发agent的框架，包括prompt工程管理，大模型统一接口封装调用，对话记忆模块，工具调用链逻辑，链式执行逻辑等
RAG即Retrieval Augumented Generation，检索内容增强，可以避免模型幻觉（胡乱回答）、模型回答的内容不是最新实时的，私有知识库无法接入等问题。其步骤一般是：RAG分在线与离线两部分，离线部分会不断的将本地知识库新增内容，embedding进入向量数据库（转成数字形式，方便计算机理解与检索）；用户提问后，会将用户问题也向量化与向量数据库中的内容做对比，检索出最为匹配的数据；然后将检索出来的数据与用户的问题整理成新的prompt词；最后将新的prompt发给LLM，然后等待LLM回答。
chatgpt-image2模型出世，抖音热点
Anthropic 的最强模型现在是opus 4.7（但是多调侃该模型大量蒸馏，融合其它模型，回答变得不可靠）
agent是一个将多模态模型作为大脑来做规划，可以选择合适的skill来执行任务，如果现在tool解决不了问题，还可调用外部工具MCP。
阿里的灵光，现在有一个激励创作闪应用的活动，具有现金奖励。
MQ，为了应对高并发场景，生产者的请求，可先放置在消息队列中，消费者不必同一时间处理那么多的请求，而是可以尽力而为，处理不了的就在消息队列中等待。这样生产者也就不必一直等待消费者，等消费者完成后通知生产者即可。如下单与发货，两者相互独立，只处理与自己相关的事情即可。
docker image 类似于软件的安装包，包含了安装一个软件所需的全部。容器是运行这些软件的实例。
RustFS，指的是一个用Rust语言编写的，可快速搭建一个高性能的fileSystem的框架。

2026.4.19

Sun, 19 Apr 2026 00:00:00 +0000

prompt工程，使用恰当的提问方式有助于大模型的问题回答—比如：举例子，分步骤，定身份。
docker容器里面运行的应用，有两个端口，一个是本地环境监听端口（宿主机端口），另一个是docker容器内网端口，两个监听的端口号不一定一致。配置文件永远写容器内端口。
如果容器内有数据库要运行sql脚本，必须先把这个sql文件添加到docker容器该数据库内部，然后才可以执行该sql脚本。
npm是下载nodejs自带的包管理工具，yarn是第三方包管理工具。
12306项目运行起来的过程，让ai生成docker-compose文件，运行它生成一个该项目可以运行的后端容器环境，然后使用mvn命令编译该项目，并生成一个的jar包，切换到该jar包所在目录，运行java -jar命令，启动该后端，前端页面另启。
修改create fatal页面的bug
- 调整页面UI，增加两个空白占位符，强制换行与其它框体对齐
- 地址栏换行，调用文本框公共组件，讲地址栏的内容强制切片，每行最多30个字符，传给后端的数据形式是：完整地址内容，切片地址内容addr1，addr2 ，……
- 默认值问题
- …….

2026.4.17

Fri, 17 Apr 2026 00:00:00 +0000

使用openAI的SDK可方便的调用兼容openAI接口协议的第三方大模型，因为大部分api provider都兼容openAI的SDK规则。可以自定义模型输出的方式是否为流式输出
NoSql，非关系型数据库最早先的定义是not only sql，意味着也存在可以使用sql语句来使用非关系型数据库的情况。Nosql型数据库，主要分key-value类型，文档类型，图类型等。NoSql数据库天生适合分布式场景，拿MongoDB Altas来举例，其使用分布式集群，在不同的节点中存储数据，其特点具有数据冗余（一份数据可以存储多份，以防丢失），数据分片sharding（大量的数据，一个节点存储不下，可以选择一个分片键自动按范围/哈希拆分海量数据，分布到不同的集群节点，例如年份2025的放到节点A，年份2026的放置到节点B）。这些特性的存在是的这种非关系型数据库非常方便横向扩展（增加集群中的节点数量），而传统的关系性数据库和横向扩展非常困难（其实也可以主从、分库分表横向扩展，只是比NoSQL麻烦很多），其一般采取的扩容方式是纵向扩展（升级单机配置）。
字符编码解码，电脑只能理解二进制数据，而我们的现实世界中的字符它是理解不了的，因此为了让电脑理解，便有了字符编码，将字符与二进制编码一一对应，例如a-01100001；字符解码即找到字符的二进制编码。比较著名的编码方式有ASCLL，通常用一个字节（8个bit，实际上是7个bit）来对英文字符与特殊符号进行编码，因为开发较早，不支持英文以外的字符。后来各个国家开发可以兼容自己的开发编码方式，如兼容汉字的GBK等。但是这些编码方式各不相同，即同一个二进制编码可能对应着不同的字符。为了解决这个情况，出现了unicode编码，因为有些编码方式没有区分不同字符使用的字节数量，会浪费存储空间。后面出现了可随字符的不同，使用不同字节数量的编码方式UTF-8（可用字节数为1-4）UTF-16（2-4字节），UTF-32（4字节）。在mysql数据库中，存在DBMS层级、数据库、表、字段四种层级的编码方式，其编码的优先级越来越高。需要注意的是，mysql数据库种存在的utf-8并不是真正的utf-8而是utf-8mb3（most bytes ），utf-8mb4才是真正的utf—8。
maven项目中如果存在mvnw文件，则不强制用户安装maven。
winget是windows方便用户使用命令下载软件的的快捷命令。与npm不同得地方在于一个是系统层级下载软件，一个是代码层面的下载依赖。
Docker主要的作用保证环境的一致性。