php

php开源分词类库

 
php简单分词类库 不需要安装扩展,自带字典,使用方法简单
基于scws,phpanalysis

参考代码如下:
 
<?php
header("Content-Type:text/html; charset=utf-8");
define('APP_ROOT', str_replace('\\', '/', dirname(__FILE__)));

$con = 'php交流社区,php问答社区,IT技术问答,知了问答社区';

echo $con."\
n";
function get_tags_arr($title)
{
require(APP_ROOT.'/pscws4.class.php');
$pscws = new PSCWS4();
$pscws->set_dict(APP_ROOT.'/scws/dict.utf8.xdb');
$pscws->set_rule(APP_ROOT.'/scws/rules.utf8.ini');
$pscws->set_ignore(true);
$pscws->send_text($title);
$words = $pscws->get_tops(5);
$tags = array();
foreach ($words as $val) {
$tags[] = $val['word'];
}
$pscws->close();
return $tags;
}

print_r(get_tags_arr($con))."<br/>";

function get_keywords_str($content){
require(APP_ROOT.'/phpanalysis.class.php');
PhpAnalysis::$loadInit = false;
$pa = new PhpAnalysis('utf-8', 'utf-8', false);
$pa->LoadDict();
$pa->SetSource($content);
$pa->StartAnalysis( false );
$tags = $pa->GetFinallyResult();
return $tags;
}

print(get_keywords_str($con));

输出结果:
 
php交流社区,php问答社区,IT技术问答,知了问答社区
Array
(
[0] => 问答
[1] => 社区
[2] => 交流社区
[3] => php
[4] => 技术
)

交流社区,问答,社区,技术,问答

下载地址:https://github.com/kcloze/participle

0 个评论

要回复文章请先登录注册