《L01 基础入门》
我们将带你从零开发一个项目并部署到线上,本课程教授 Web 开发中专业、实用的技能,如 Git 工作流、Laravel Mix 前端工作流等。
《G01 Go 实战入门》
从零开始带你一步步开发一个 Go 博客项目,让你在最短的时间内学会使用 Go 进行编码。项目结构很大程度上参考了 Laravel。
关于 LearnKu
完全相同去重,可以用md5校验;
文本内容相似度去重,需要用到类似simhash的算法,计算出一个向量距离,然后计算出相似度;
之前在学生提交作业(文本)防抄袭场景下做过一个,不过效果不怎么好,后来也没正式用起来。
es可以用起来吧
可以试试看下能否使用:
你这只能通过分析文本向量,然后用向量搜索,如果有数据就不插入!
我用的是这个,不过我对比的都是几十到几百字的,文章没试过
segmentfault.com/q/101000000245390...
github.com/xiaobeicn/text-similari...