蜜桃无码视频,欧美日韩一=三道夲,国产精品午夜AV电影网免费看,aaa.www

歡迎來到 常識(shí)詞典網(wǎng) , 一個(gè)專業(yè)的常識(shí)知識(shí)學(xué)習(xí)網(wǎng)站!

[ Ctrl + D 鍵 ]收藏本站

您所在的位置:首頁 > 教育學(xué)習(xí) > 百科

百科

淘寶、阿里巴巴等電商平臺(tái)的站內(nèi)搜索中其詞庫估計(jì)都是如何建設(shè)的?

分類: 百科 常識(shí)詞典 編輯 : 常識(shí) 發(fā)布 : 09-07

閱讀 :373

淘寶、阿里巴巴等電商平臺(tái)的站內(nèi)搜索中其詞庫估計(jì)都是如何建設(shè)的?1、類似淘寶、阿里巴巴(包括中英文)、亞馬遜、ebay等電子商務(wù)平臺(tái),其站內(nèi)搜索中,詞庫建設(shè)中估計(jì)都有哪些要點(diǎn),估計(jì)都是大致怎么樣的方案?會(huì)有同義詞、上位詞、下位詞、集中詞、分散詞、隱藏詞等等概念么?2、另外這些電子商務(wù)平臺(tái)的詞庫基本上都是名詞為主的詞庫,這個(gè)和通用搜索引擎的詞庫存在比較大的差別,針對(duì)這一情況,需要有些與通過搜索引擎詞庫怎樣不同的設(shè)計(jì)?4 個(gè)答案

答案 1:

因?yàn)椴辉跇I(yè)務(wù)前線,我只能說說通用的詞庫大致怎么來的。針對(duì)不同的類別,用規(guī)則定向去某些特定網(wǎng)頁或某種特定模式挖掘,從文本中抽取,并加上統(tǒng)計(jì)信息和規(guī)則過濾。這里的類別指的是產(chǎn)品名稱 電影名稱這樣的。抽取的結(jié)果和中文基本詞庫合并,就是詞典的base版本新詞挖掘是另一件事,用戶查詢?nèi)罩竞途W(wǎng)頁中的詞頻等都是很重要的信息,最后是用機(jī)器學(xué)習(xí)的分類來做的,crf用于新詞發(fā)現(xiàn)也不錯(cuò),但真正要結(jié)果好用,過濾要花不少工夫。-的新詞就基于crf同義上下位都有做。 集中分散?你是說統(tǒng)稱和具體名稱么,這個(gè)也有。 隱藏詞因?yàn)殡娚虣z索很在乎召回率,是重點(diǎn)做過的。

答案 2:

感謝邀請,但我不適合回答這個(gè)問題,因?yàn)槲覜]去過,所以不了解。詞庫建設(shè)是個(gè)持續(xù)過程,需要有新詞和未登陸詞發(fā)現(xiàn)解決方案。記得在z-i-u上看到有阿里的人說他們第一個(gè)把CRF用于分詞商業(yè)化了。一般來說,新詞和未登陸詞發(fā)現(xiàn)都采用統(tǒng)計(jì)方案,CRF是其中很好的工具。

答案 3:

概念性的東西我看你也了解了,最重要的是通過用戶行為(熱門搜索)補(bǔ)充詞庫。

答案 4:

淘寶、亞馬遜這樣的電子商務(wù)網(wǎng)站,他們的搜索應(yīng)該更加側(cè)重于商品名,詞庫的建設(shè)應(yīng)該主要著重點(diǎn)在商品名詞表的建設(shè)當(dāng)中吧,我覺得對(duì)于電子商務(wù)網(wǎng)站來說,數(shù)據(jù)都是格式化的或者就直接存在數(shù)據(jù)庫里面,想要獲取他們的商品名等各種信息還是比較容易的。無需用到CRF來做分詞或新詞發(fā)現(xiàn)吧?

下一篇:你熟知多少瘋言瘋語? 下一篇 【方向鍵 ( → )下一篇】

上一篇:思科還可以稱霸多少年? 上一篇 【方向鍵 ( ← )上一篇】

曰韩无码二三区中文字幕| 一级无码毛片在线免费| 香蕉久久人人| www.夜夜骑一区| 人妻久久精品一区二区夜夜嗨 | 五月婷婷网网| aV日韩毛片| 日韩中文字幕一区| 老鸭窝一区二区三区四区| 国产白丝在线观看| 国产精品爆乳中文一区二区 | 福利久久久| 日韩字幕久久| 伊人久久大杳蕉综合大象| 日本精品国产高清流出| 欧美日韩精品一区二区视频永久免| 久草人妻在线| 中文字幕人妻系列无码AV| 日本天天干夜夜操| 人人妻人人澡人人爽人人精品吃奶| 久久中精品中文字幕入口| 亚洲欧美日韩中文系列| 久热精品视频大全| 中美日韩毛片免费播放| 国产日韩黄片在线看| 日韩在线五码| 麻豆一区二区三区蜜桃免费| 丰满少妇被猛烈进入高清APP| 国产99大香蕉| 国内精品啪啪| 美女一区二区三区毛片久久精品 | 国产成人做受免费视频| 国内综合在线| 成人国产一区在线观看| 黄色片一级免费看处女| 另类观看成人| 在线免费观看亚洲| av无码av不卡一区二区| 欧美偷拍| 亚洲人伦无码视频| 久热最新视频|