前语
曾经在 github 上自己开源了一些项目。碍于技能与精力,大部分项目都是 java 完成的。
这关于非 java 开发者而言很不友爱,关于不会编程的用户愈加不友爱。
为了让更多的人能够运用到这些简略的小工具,周末抽时间将几个开源项目增加了 web 服务完成。
开源项目
中文繁简体转化
简介:支撑中文繁简体的在线转化。
在线地址:houbb.github.io/opensource/…
开源地址:github.com/houbb/openc…
用法简介
此处仅挑选一个作为比方介绍,其他用法大同小异。
【处理】将左边的内容,依照下拉框的挑选,结果会自动填充在右边。
【交换】交换左右两头的内容。平常测验繁体=》简体,和简体=》繁体愈加便利。
【仿制】仿制右边的内容到粘贴板。
灵敏词
简介:基于 DFA 算法完成的高性能 java 灵敏词工具框架。请勿发布触及政治、广告、营销、翻墙、违反国家法律法规等内容。
在线地址:houbb.github.io/opensource/…
开源地址:github.com/houbb/sensi…
拼音
简介:高性能中文转拼音工具。支撑同音字。
在线地址:houbb.github.io/opensource/…
开源地址:github.com/houbb/pinyi…
能够很便利的把一段文字转化为对应的拼音,比方前语的内容默认如下:
y qin zi github shng z j ki yun le y xi xing m 。 i y j sh y jng l , d b fn xing m du sh java sh xin de 。 zh du y fi java ki f zh r yn hn b yu ho , du y b hu bin chng de yng h gng ji b yu ho 。 wi le rng gng du de rn k y sh yng do zh xi jin dn de xio gng j , zhu m chu sh jin jing j g ki yun xing m tin ji le web f w sh xin 。
分词
简介:基于结巴分词词库完成的愈加灵敏优雅易用,高性能的 java 分词完成。
在线地址:houbb.github.io/opensource/…
开源地址:github.com/houbb/segme…
分词,能够说是 NLP 的基石。
前语的内容分词效果如下:
[曾经[0,2), 在[2,3), [3,4), github[4,10), [10,11), 上自[11,13), 己[13,14), 开源[14,16), 了[16,17), 一些[17,19), 项目[19,21), 。[21,22), 碍于[22,24), 技能[24,26), 与[26,27), 精力[27,29), ,[29,30), 大部分[30,33), 项目[33,35), 都[35,36), 是[36,37), [37,38), java[38,42), [42,43), 完成[43,45), 的[45,46), 。[46,47), [47,48), [48,49), 这[49,50), 关于[50,52), 非[52,53), [53,54), java[54,58), [58,59), 开发者[59,62), 而言[62,64), 很[64,65), 不[65,66), 友爱[66,68), ,[68,69), 关于[69,71), 不会[71,73), 编程[73,75), 的[75,76), 用户[76,78), 愈加[78,80), 不[80,81), 友爱[81,83), 。[83,84), [84,85), [85,86), 为了[86,88), 让[88,89), 更多[89,91), 的[91,92), 人[92,93), 能够[93,95), 运用[95,97), 到[97,98), 这些[98,100), 简略[100,102), 的[102,103), 小工[103,105), 具[105,106), ,[106,107), 周末[107,109), 抽时间[109,112), 将[112,113), 几个[113,115), 开源[115,117), 项目[117,119), 增加[119,121), 了[121,122), [122,123), web[123,126), [126,127), 服务[127,129), 完成[129,131), 。[131,132)]
汉字类似度
简介:汉字类似度计算工具。中文形近字算法
在线地址:houbb.github.io/opensource/…
开源地址:github.com/houbb/nlp-h…
markdown 目录
简介:为 markdown 文件生成 toc 目录
在线地址:houbb.github.io/opensource/…
开源地址:github.com/houbb/markd…
个人平常的博客都是运用 markdown 编写的,专注于写作。markdown-toc 能够为这样的文本生成对应的 toc。
比方本篇文章,直接放在 github 上,是支撑跳转的。
* [前语](#前语)
* [开源项目](#开源项目)
* [中文繁简体转化](#中文繁简体转化)
* [用法简介](#用法简介)
* [灵敏词](#灵敏词)
* [拼音](#拼音)
* [分词](#分词)
* [汉字类似度](#汉字类似度)
* [markdown 目录](#markdown-目录)
小结
这样的小工具,完成起来十分简略。
但是关于用户而言,含义仍是比较大的。
最近在学习一些 AI 相关的东西,自己平常不搞 python,很多开源项目,没有 web 体验版别看起来就会很吃力。
不同的言语产生了难以逾越的距离,愿你我能够借助 WEB 的力量,跨过去。
原文地址
开源项目在线化