五十路一区二区三区视频,久久免费Av播放,综合欧美亚洲日本少妇,国产高清精品aaa

  1. <td id="auzpv"></td>
    <td id="auzpv"><dfn id="auzpv"></dfn></td>
    您的位置:首頁>互聯(lián)網(wǎng)>

    Clickbait的秘密曝光了 人類和AI聯(lián)手改善點擊誘餌檢測

    賓夕法尼亞州立大學(xué)和亞利桑那州立大學(xué)的研究人員說,人類和機器共同協(xié)作,以幫助訓(xùn)練一種優(yōu)于其他點擊誘餌檢測器的人工智能模型。他們說,此外,新的基于AI的解決方案還能夠分辨出由機器(或機器人)生成的clickbait標(biāo)題與由人編寫的clickbait標(biāo)題之間的區(qū)別。

    在一項研究中,研究人員要求人們編寫自己的點擊誘餌-這是一個有趣但具有誤導(dǎo)性的新聞標(biāo)題,旨在吸引讀者點擊其他在線故事的鏈接。研究人員還對機器進(jìn)行了編程以生成人工點擊誘餌。然后,將人和機器的標(biāo)題作為數(shù)據(jù)來訓(xùn)練點擊誘餌檢測算法。

    研究人員表示,由此產(chǎn)生的算法預(yù)測點擊誘餌標(biāo)題的能力比其他系統(tǒng)好14.5%,研究人員今天(8月28日)在2019年IEEE / ACM國際社交網(wǎng)絡(luò)分析先進(jìn)會議(ASONAM)上發(fā)布了他們的發(fā)現(xiàn)。加拿大溫哥華。

    該項目的首席研究員,信息科學(xué)與技術(shù)學(xué)院副教授Dongwon Lee表示,除了將其用于點擊誘餌檢測之外,該團(tuán)隊的方法還可能有助于總體上提高機器學(xué)習(xí)性能。Lee還是賓夕法尼亞州立大學(xué)計算機科學(xué)研究所(ICS)的附屬機構(gòu),該研究所為賓夕法尼亞州立大學(xué)的研究人員提供了超級計算資源的訪問權(quán)限。

    “我們成功地證明了機器生成的點擊誘餌訓(xùn)練數(shù)據(jù)可以反饋到訓(xùn)練管道中,以訓(xùn)練各種各樣的機器學(xué)習(xí)模型來提高性能,這一結(jié)果非常有趣。” Lee說。“這是解決需要大量高質(zhì)量培訓(xùn)數(shù)據(jù)的監(jiān)督型機器學(xué)習(xí)的基本瓶頸的一步。”

    賓夕法尼亞州立大學(xué)信息科學(xué)與技術(shù)學(xué)院的一名博士生Thai Le表示,點擊誘餌檢測技術(shù)的發(fā)展面臨的挑戰(zhàn)之一是缺乏標(biāo)記數(shù)據(jù)。就像人們需要老師和學(xué)習(xí)指南來幫助他們學(xué)習(xí)一樣,人工智能模型也需要帶有標(biāo)簽的數(shù)據(jù)來幫助他們學(xué)習(xí)建立正確的聯(lián)系和關(guān)聯(lián)。

    Le說:“當(dāng)我們開始這個項目時,我們意識到的一件事是,我們沒有很多積極的數(shù)據(jù)點。”“為了識別點擊誘餌,我們需要讓人員標(biāo)記訓(xùn)練數(shù)據(jù)。有必要增加正面數(shù)據(jù)點的數(shù)量,以便以后我們可以訓(xùn)練更好的模型。”

    盡管在互聯(lián)網(wǎng)上找到點擊誘餌很容易,但點擊誘餌的多種變化又增加了另一層難度,據(jù)Donald P媒體效應(yīng)教授兼媒體效應(yīng)研究實驗室聯(lián)合主任James P. Jimirro的S. Shyam Sundar稱。 Bellisario通信學(xué)院,以及ICS子公司。

    “有一些點擊誘餌是列表或列表;有一些點擊誘餌被表述為問題;有一些以誰,什么地方,何時開始;還有我們在研究中發(fā)現(xiàn)的各種其他種類的點擊誘餌。年。”桑達(dá)爾說。“因此,要找到足夠數(shù)量的所有這些類型的Clickbait樣本是一個挑戰(zhàn)。盡管我們都在抱怨周圍的Clickbait數(shù)量,但是當(dāng)您四處獲取并標(biāo)記它們時,這些數(shù)據(jù)集并不多。”

    根據(jù)研究人員的說法,該研究揭示了人和機器在創(chuàng)建標(biāo)題方面的差異。與機器產(chǎn)生的點擊誘餌相比,人們產(chǎn)生的標(biāo)題傾向于在其標(biāo)題中包含更多確定性詞(例如“ that”和“ that”)。

    培訓(xùn)似乎也促使點擊誘餌的創(chuàng)建有所不同。例如,受過訓(xùn)練的作家(例如記者)比其他參與者傾向于使用更長的單詞和更多的代詞。記者也可能會使用數(shù)字作為頭條新聞。

    據(jù)Sundar稱,研究人員計劃利用這些發(fā)現(xiàn)來指導(dǎo)他們對更強大的假新聞檢測系統(tǒng)的研究。

    Sundar說:“對我們來說,點擊誘餌只是構(gòu)成虛假新聞的眾多因素之一,但是這項研究是確保我們建立良好的點擊誘餌檢測系統(tǒng)的有用準(zhǔn)備步驟。”

    為了尋找人類點擊誘餌作者進(jìn)行研究,研究人員從在線人群資源網(wǎng)站Amazon Turk招募了新聞專業(yè)的學(xué)生和工人。他們從現(xiàn)場招募了125名學(xué)生和85名工人。參與者首先閱讀了clickbait的定義,然后被要求閱讀了簡短的文章(約500個單詞)。然后要求參與者為每篇文章寫一個點擊誘餌標(biāo)題。

    機器生成的點擊誘餌標(biāo)題是使用稱為變分自動編碼器(VAE)生成模型的機器學(xué)習(xí)模型開發(fā)的,該模型依賴于在數(shù)據(jù)中查找模式的可能性。

    研究人員針對在線點擊誘餌檢測競賽Clickbait Challenge 2017的頂級系統(tǒng)測試了他們的算法。

    賓夕法尼亞州大眾傳播學(xué)的博士候選人Maria Molina也為這項研究做出了貢獻(xiàn)。亞利桑那州立大學(xué)的計算機科學(xué)與工程教授劉歡和計算機科學(xué)與工程博士學(xué)位候選人凱舒。

    國家科學(xué)基金會,橡樹嶺聯(lián)合大學(xué)和海軍研究辦公室支持這項工作。

    免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!