中國周刊

用“菁準(zhǔn)數(shù)據(jù)”創(chuàng)造數(shù)據(jù)倉庫的智能搬運(yùn)工

2020-09-02 20:59:43 來源:中國周刊 作者:侯智勇

自人工智能入選“2017年度中國媒體十大流行語”以來,其已逐步深入應(yīng)用到醫(yī)療、天文、工業(yè)基建等各個(gè)重大領(lǐng)域。隨著當(dāng)下各種數(shù)據(jù)的激增,人工智能在數(shù)據(jù)采集和標(biāo)注方面發(fā)揮著越來越重要的作用?;诋?dāng)今社會(huì)科學(xué)發(fā)展的大背景,在“大膽假設(shè)、小心求證”的理念下推出“菁準(zhǔn)數(shù)據(jù)”項(xiàng)目,旨在做全國人工智能企業(yè)數(shù)據(jù)優(yōu)質(zhì)服務(wù)商。

數(shù)據(jù)采集快速“菁準(zhǔn)”,數(shù)據(jù)質(zhì)量穩(wěn)定輸出

當(dāng)下市場上的數(shù)據(jù)采集與標(biāo)注常常出現(xiàn)數(shù)據(jù)質(zhì)量參差不齊、數(shù)據(jù)獲取困難且價(jià)格高等多重問題。傳統(tǒng)的解決方案是通過爬蟲手段進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)采集,將采集下的數(shù)據(jù)由AI工程師進(jìn)行標(biāo)注。其往往導(dǎo)致采集樣本多樣性不足,數(shù)據(jù)標(biāo)注成本高,數(shù)據(jù)標(biāo)注處理效率低等問題。針對(duì)市場痛點(diǎn),“菁準(zhǔn)數(shù)據(jù)”根據(jù)數(shù)據(jù)采集做出數(shù)據(jù)集后再對(duì)數(shù)據(jù)進(jìn)行標(biāo)注的方式,即通過將數(shù)據(jù)進(jìn)行有效拆分,在達(dá)到省時(shí)省力省錢的同時(shí),有效保證數(shù)據(jù)產(chǎn)量、質(zhì)量的穩(wěn)定輸出。

其中在數(shù)據(jù)采集方面,主要采用網(wǎng)頁數(shù)據(jù)采集系統(tǒng),打造線上自動(dòng)化的數(shù)據(jù)采集器,可視化操作,一鍵自動(dòng)采集,從而能夠大面積解決網(wǎng)絡(luò)數(shù)據(jù)抓取問題。同時(shí)利用數(shù)據(jù)采集小程序,基于圖片相似度算法(感知哈希算法),基于RNN神經(jīng)網(wǎng)絡(luò)的音頻降噪算法等用于不同場景的圖像、語音等數(shù)據(jù)采集,方便快捷,可快速大量完成一般性數(shù)據(jù)采集任務(wù)。除此之外,又以圍繞高校密集型人群場所為核心,建立“采集小站”的模式完成較高難度的定制化數(shù)據(jù)采集任務(wù)。計(jì)劃初期以實(shí)際項(xiàng)目為合作入口逐漸積累不同行業(yè)資源,最終實(shí)現(xiàn)全行業(yè)覆蓋,以構(gòu)建“行業(yè)”到“AI”雙向互贏的橋梁策略,完成行業(yè)內(nèi)數(shù)據(jù)采集任務(wù)。

在數(shù)據(jù)標(biāo)注方面,充分發(fā)揮眾包模式的優(yōu)勢,讓用戶可以在數(shù)據(jù)標(biāo)注平臺(tái)快速、低成本地完成數(shù)據(jù)標(biāo)注任務(wù),發(fā)展初期在保證數(shù)據(jù)產(chǎn)量質(zhì)量穩(wěn)定輸出的同時(shí),可以全周期完成高難度的標(biāo)注任務(wù)。

線上與線下營銷結(jié)合,打造營銷方式多樣化

“精準(zhǔn)數(shù)據(jù)”的推廣主要通過線上營銷與線下營銷相結(jié)合的模式,在打造營銷模式多樣化的同時(shí)擴(kuò)大其品牌影響力。其中線上營銷主要通過“官微+微信公眾號(hào)”的模式,專業(yè)媒體如網(wǎng)易新聞、頭條新聞等,另外通過百度推廣等多種線上營銷媒介來擴(kuò)大影響力。同時(shí)結(jié)合線下營銷,如與AI垂直領(lǐng)域國際孵化器建立合作,實(shí)現(xiàn)“菁準(zhǔn)營銷”,組織各類AI論壇沙龍,商務(wù)上門拜訪,與AI企業(yè)進(jìn)行面對(duì)面商談,參加展會(huì)擴(kuò)大品牌知名度等等,在擴(kuò)大知名度的同時(shí)及時(shí)了解行業(yè)信息。

智能語音切入為主,拓展消費(fèi)目標(biāo)領(lǐng)域

目前“精準(zhǔn)數(shù)據(jù)”主要以智能語音企業(yè)為主要切入口,同時(shí)拓展至金融、教育、醫(yī)療、家庭家居、無人駕駛、內(nèi)容審核等眾多領(lǐng)域。主要根據(jù)項(xiàng)目需求,專門為企業(yè)獨(dú)家定制數(shù)據(jù)方案,關(guān)于公司所自營的數(shù)據(jù)集,企業(yè)客戶可購買該數(shù)據(jù)的共享使用權(quán),同時(shí)也可以買斷數(shù)據(jù)版權(quán)。截至目前向巳科技已與國內(nèi)第一大語音商科大訊飛、國內(nèi)第二大語音商思必馳、網(wǎng)易網(wǎng)絡(luò)有限公司等多家知名企業(yè)進(jìn)行合作。

關(guān)于企業(yè)未來的規(guī)劃,核心團(tuán)隊(duì)人員表示預(yù)計(jì)2020年資金流水將達(dá)到2600萬,公司目前的運(yùn)營基地主要分布在成都、海南和云南,屆時(shí)將完成全國20處運(yùn)營基地的布局,并進(jìn)行眾包平臺(tái)AI化研發(fā),通過高新企業(yè)雛鷹企業(yè)認(rèn)定等。未來,“菁準(zhǔn)數(shù)據(jù)”將繼續(xù)利用人工智能創(chuàng)造數(shù)據(jù)倉庫的智能搬運(yùn)工。(鄭應(yīng)松)



編輯:楊文博

已經(jīng)到底部