五十路一区二区三区视频,久久免费Av播放,综合欧美亚洲日本少妇,国产高清精品aaa

<td id="auzpv"></td>

<td id="auzpv"><dfn id="auzpv"></dfn></td>

<center id="jppzm"><menu id="jppzm"><samp id="jppzm"></samp></menu></center>

您的位置：首頁>互聯(lián)網(wǎng)>

Clickbait的秘密曝光了人類和AI聯(lián)手改善點擊誘餌檢測

2020-04-21 15:13:57來源：

賓夕法尼亞州立大學(xué)和亞利桑那州立大學(xué)的研究人員說，人類和機器共同協(xié)作，以幫助訓(xùn)練一種優(yōu)于其他點擊誘餌檢測器的人工智能模型。他們說，此外，新的基于AI的解決方案還能夠分辨出由機器(或機器人)生成的clickbait標(biāo)題與由人編寫的clickbait標(biāo)題之間的區(qū)別。

在一項研究中，研究人員要求人們編寫自己的點擊誘餌-這是一個有趣但具有誤導(dǎo)性的新聞標(biāo)題，旨在吸引讀者點擊其他在線故事的鏈接。研究人員還對機器進(jìn)行了編程以生成人工點擊誘餌。然后，將人和機器的標(biāo)題作為數(shù)據(jù)來訓(xùn)練點擊誘餌檢測算法。

研究人員表示，由此產(chǎn)生的算法預(yù)測點擊誘餌標(biāo)題的能力比其他系統(tǒng)好14.5%，研究人員今天(8月28日)在2019年IEEE / ACM國際社交網(wǎng)絡(luò)分析先進(jìn)會議(ASONAM)上發(fā)布了他們的發(fā)現(xiàn)。加拿大溫哥華。

該項目的首席研究員，信息科學(xué)與技術(shù)學(xué)院副教授Dongwon Lee表示，除了將其用于點擊誘餌檢測之外，該團(tuán)隊的方法還可能有助于總體上提高機器學(xué)習(xí)性能。Lee還是賓夕法尼亞州立大學(xué)計算機科學(xué)研究所(ICS)的附屬機構(gòu)，該研究所為賓夕法尼亞州立大學(xué)的研究人員提供了超級計算資源的訪問權(quán)限。

“我們成功地證明了機器生成的點擊誘餌訓(xùn)練數(shù)據(jù)可以反饋到訓(xùn)練管道中，以訓(xùn)練各種各樣的機器學(xué)習(xí)模型來提高性能，這一結(jié)果非常有趣。” Lee說。“這是解決需要大量高質(zhì)量培訓(xùn)數(shù)據(jù)的監(jiān)督型機器學(xué)習(xí)的基本瓶頸的一步。”

賓夕法尼亞州立大學(xué)信息科學(xué)與技術(shù)學(xué)院的一名博士生Thai Le表示，點擊誘餌檢測技術(shù)的發(fā)展面臨的挑戰(zhàn)之一是缺乏標(biāo)記數(shù)據(jù)。就像人們需要老師和學(xué)習(xí)指南來幫助他們學(xué)習(xí)一樣，人工智能模型也需要帶有標(biāo)簽的數(shù)據(jù)來幫助他們學(xué)習(xí)建立正確的聯(lián)系和關(guān)聯(lián)。

Le說：“當(dāng)我們開始這個項目時，我們意識到的一件事是，我們沒有很多積極的數(shù)據(jù)點。”“為了識別點擊誘餌，我們需要讓人員標(biāo)記訓(xùn)練數(shù)據(jù)。有必要增加正面數(shù)據(jù)點的數(shù)量，以便以后我們可以訓(xùn)練更好的模型。”

盡管在互聯(lián)網(wǎng)上找到點擊誘餌很容易，但點擊誘餌的多種變化又增加了另一層難度，據(jù)Donald P媒體效應(yīng)教授兼媒體效應(yīng)研究實驗室聯(lián)合主任James P. Jimirro的S. Shyam Sundar稱。 Bellisario通信學(xué)院，以及ICS子公司。

“有一些點擊誘餌是列表或列表;有一些點擊誘餌被表述為問題;有一些以誰，什么地方，何時開始;還有我們在研究中發(fā)現(xiàn)的各種其他種類的點擊誘餌。年。”桑達(dá)爾說。“因此，要找到足夠數(shù)量的所有這些類型的Clickbait樣本是一個挑戰(zhàn)。盡管我們都在抱怨周圍的Clickbait數(shù)量，但是當(dāng)您四處獲取并標(biāo)記它們時，這些數(shù)據(jù)集并不多。”

根據(jù)研究人員的說法，該研究揭示了人和機器在創(chuàng)建標(biāo)題方面的差異。與機器產(chǎn)生的點擊誘餌相比，人們產(chǎn)生的標(biāo)題傾向于在其標(biāo)題中包含更多確定性詞(例如“ that”和“ that”)。

培訓(xùn)似乎也促使點擊誘餌的創(chuàng)建有所不同。例如，受過訓(xùn)練的作家(例如記者)比其他參與者傾向于使用更長的單詞和更多的代詞。記者也可能會使用數(shù)字作為頭條新聞。

據(jù)Sundar稱，研究人員計劃利用這些發(fā)現(xiàn)來指導(dǎo)他們對更強大的假新聞檢測系統(tǒng)的研究。

Sundar說：“對我們來說，點擊誘餌只是構(gòu)成虛假新聞的眾多因素之一，但是這項研究是確保我們建立良好的點擊誘餌檢測系統(tǒng)的有用準(zhǔn)備步驟。”

為了尋找人類點擊誘餌作者進(jìn)行研究，研究人員從在線人群資源網(wǎng)站Amazon Turk招募了新聞專業(yè)的學(xué)生和工人。他們從現(xiàn)場招募了125名學(xué)生和85名工人。參與者首先閱讀了clickbait的定義，然后被要求閱讀了簡短的文章(約500個單詞)。然后要求參與者為每篇文章寫一個點擊誘餌標(biāo)題。

機器生成的點擊誘餌標(biāo)題是使用稱為變分自動編碼器(VAE)生成模型的機器學(xué)習(xí)模型開發(fā)的，該模型依賴于在數(shù)據(jù)中查找模式的可能性。

研究人員針對在線點擊誘餌檢測競賽Clickbait Challenge 2017的頂級系統(tǒng)測試了他們的算法。

賓夕法尼亞州大眾傳播學(xué)的博士候選人Maria Molina也為這項研究做出了貢獻(xiàn)。亞利桑那州立大學(xué)的計算機科學(xué)與工程教授劉歡和計算機科學(xué)與工程博士學(xué)位候選人凱舒。

國家科學(xué)基金會，橡樹嶺聯(lián)合大學(xué)和海軍研究辦公室支持這項工作。

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請聯(lián)系刪除！

標(biāo)簽：Clickbait

猜你喜歡

最新文章

<pre id="wpovv"></pre>