区块チェーンの大火は、区块チェーンメディアの推進なしには成り立ちません。では、皆さんは区块チェーンメディアとは何か理解していますか?実際、区块チェーンメディアは区块チェーンの内容を報道するメディアではなく、区块チェーン技術の応用に依存し、メディアコンテンツ分野に革命的な変化をもたらす新しいメディア業態です。
区块チェーンメディアは基本的に区块チェーンの情報を報道する形態にあり、熱から冷への変化を経験しました。管理下で野蛮に成長したコイン界と区块チェーンメディアは今後どこに向かうのでしょうか?
1. 情報共有、区块チェーンはデータの解放を実現
誰もが区块チェーン上で完全な歴史データを持つことができ、これはニュース業界にとって、限られた記者や編集者が大量の資料を持つことを可能にし、** データの収集や整理にかかるコストを大幅に節約します。** 区块チェーンの情報共有は、記者の伝統的な情報収集方法とは異なり、通常のネット検索とも異なります。つまり、記者は区块チェーンを通じて迅速に完全な情報を得るだけでなく、情報提供者に「直接接触」し、情報の背後にある内容をさらに分析することができます。
2. 区块チェーンは偽ニュースを打撃
ネットワーク時代において、専門的なニュースの生産はますますアマチュア化し、情報源の信頼性と権威性が保証されにくくなっています。同時に、一部の自媒体はユーザーの注意を引くために手段を選ばず、偽の情報を広め、** 偽ニュースが氾濫しています。ニュースコンテンツプラットフォームにおいて、ほとんどすべてがニュースコンテンツをランク付けするアルゴリズムを持っていますが、これらのアルゴリズムは透明ではなく、ニュースコンテンツの伝播プラットフォームの管理者にはこの選別とランク付けを操作する大きな余地があります。このランク付けの操作は、プラットフォームの利益を上げる重要な手段でもあり、最も代表的な例は「入札ランキング」** などのマーケティング手法です。
上記の Userfeeds の評価証明方法を除いて、PressCoin は各独立したニュース機関のためにニュース製品の生産と取引のためのエコシステムを構築しました。PressCoin システム内にいる独立したニュース機関は互いに依存共生しています。各独立したニュース機関には、その機関の情報を保存したデータブロックが割り当てられ、PressCoin は区块チェーンを通じてこれらの独立したニュース機関が全体システムに対してどの程度貢献しているかを評価し、再配分を行います。すべての独立したニュース機関の情報はすでに区块チェーンに記録されており、秘密鍵がなければ自由に改ざんすることはできません。偽情報を発信する機関が発見された場合、システムは区块チェーンを通じて発信源を直接特定し、相応の罰則を科すことができます。
3. 区块チェーンは追跡と著作権保護を実現
デジタル時代において、情報の伝播はもはや物理的な媒体に依存せず、著者はデジタル作品の管理を実現することが難しくなり、大量の盗作やリライトが発生しています。区块チェーンは、特定の時点におけるニュース作品の存在を証明することができ、** 区块チェーン技術のデータベースには、作品の創作時点や著作権取引の時点を含む完全な取引データが保存されており、その記録は透明で正確かつ唯一無二です。** 膨大なニュース制作作品の中でデータに基づいて追跡することができ、強力な証明力を持ち、著作権保護に強力な技術的保障を提供します。
4. 区块チェーンはソーシャルメディアユーザーのプライバシーを保護
個人情報保護は、世界中のネットワークセキュリティが直面する大きな問題であり、ユーザーのオンラインでの身分情報、閲覧履歴、創造したコンテンツは自分で管理できません。** 区块チェーンは P2P 技術を採用し、いかなる身分情報も提供する必要がなく、区块チェーン技術はデータの暗号化を実現できるだけでなく、固定されたアルゴリズムを利用して信頼を得ることができます。** このモデルでは、ユーザー個人のデータがいつオープンされ、誰にオープンされ、どの程度オープンされるかはすべてユーザー個人が許可し、もはやネット情報プラットフォームが恣意的に処理することはありません。
5. 世論分析技術の飛躍的進展を促進
区块チェーンは真実で改ざん不可能な特性を持ち、この強力な裏付けはネットワーク世論を正確に分析するための絶好の切り口となります。現在流行している世論警告プラットフォームなどが収集する情報には、曖昧さ、混沌、不正確さの問題が存在し、世論処理に必要な時間周期が長すぎます。たとえ戦略が適切でも、ターゲットが間違っている可能性があります。区块チェーンに基づいて、世論対応の方案は高度な精度を持つことになります。方案はどの人に作用し、どの手段で誘導し、どのタイミングで実施するか、これらの詳細の精度が大幅に効率を向上させます。
ポール・レヴィンソンは **「補償的メディア」と「メディアの人間化の傾向」** の概念を提唱し、人類はメディアの進化の過程で理性的な選択を繰り返していると指摘しました。人類の技術はますます完璧になっていますが、新しいメディアは新たな問題をもたらします。メディアの進化は人の選択の結果であり、人のニーズをよりよく満たすメディアが残されます。ある意味で、** 区块チェーン技術は過去の技術に対する補償であり、プライバシーの保護や情報源の確認など、区块チェーン技術は現在の社会の人々のニーズをよりよく満たすことができます。** しかし、区块チェーン技術は時代の発展に応じた技術に過ぎず、すべての問題を解決することはできません。
まず、区块チェーンは新しい技術であり、最も緊急の問題は ** 統一された基準と法的手続きが欠如していることです。** スマートコントラクトの責任主体の欠如、区块チェーンが提供する著作権証明が直接的な法的効力を持たない問題など、一連の問題は区块チェーンの法律と規制が急速に整備される必要があることを意味します。
次に、** 区块チェーンの改ざん不可能性と忘れられる権利が衝突しています。** デジタル技術とグローバルネットワークの発展により、人類の記憶と忘却のパターンは根本的に変わり、忘却が例外となり、記憶が常態となりました。インターネット上で個人に関するネガティブな情報が広まった場合、法律に違反しない限り、個人はデータ管理者に対してそのような情報を永久に削除するよう要求する権利があります。しかし、区块チェーンの改ざん不可能性は、忘れられる権利をどこに行くべきか分からない困難な状況に置きます。
さらに、** 区块チェーン技術が本当に偽ニュースを抑制できるかどうかも疑問です。** 一方で、技術的には、ニュース業界で区块チェーン技術の運用原理を理解している人はほとんどいません。現在、ニュースコンテンツプラットフォーム自体に「アルゴリズムのブラックボックス」が存在するので、アルゴリズムプログラムに依存する区块チェーン技術も同様の問題を抱えているのではないでしょうか?
メディア革命はすでに到来しています。
メディアは、この情報の巨大化、カプセル化の世界で、区块チェーン技術に基づいた分散型、非中央集権の新しいメディアエコシステムを構築します。
メディアとは何ですか?教科書の定義によれば —— メディアは、伝播者から受け手に情報を伝達する媒体です。区块チェーン時代において、メディアの属性は質的に変化しています。
メディアの変遷は大きく四つの時代に分けることができます。
最初の時代は古典メディア時代で、伝統的な新聞、雑誌、放送が古典メディアに属します。
第二の時代はソーシャルメディア時代で、ソーシャルメディアは人々が互いに見解や意見を共有するプラットフォームであり、人々は 7 時にテレビの前に座ってニュースを見る必要がなく、すべての情報源は友達のタイムラインや微博をスクロールすることに変わりました。「友達のタイムラインは生活様式となった」;
第三の時代はインテリジェントメディア時代で、大データがあなたの読書習慣を計算し、ニュースをクリックすると無数の類似ニュースが表示されます。しかし、アルゴリズムが構築した読書の世界では、人々は各自の主観的な好みの情報や意見の渦に巻き込まれやすく、世論は統一されず、世界の呈示方法もますます断片化しています;
第四の時代は区块チェーンメディア時代で、このシステムでは偽ニュースを排除でき、コンテンツのインセンティブと収益化を得ることができ、記事を書くことや読むことが収益につながり、誰もがクリエイターであり受益者です。
真の区块チェーンメディアは、区块チェーンを報道するメディア(Blockchain Reports)ではなく、区块チェーンの分散型、非中央集権、改ざん不可能、共同維持、スマートコントラクトの技術的特性を活用し、トークンを発行できる新しい分散型メディア(Distributed Media)です。区块チェーン技術と応用を基盤にし、区块チェーンの思考と方法でメディアを運営することは、人類社会の発展における全く新しいメディアエコシステムです。
メディアを代表して、最初の三つの時代のメディアはすべて中央集権的なプラットフォームであり、記事の生死を握り、審査メカニズムは透明ではありません。たとえば、WeChat 公式アカウントでは、記事が公開されるかどうかは機械または人工編集者の審査が必要であり、すべての記事は中央集権的なプラットフォームを通過しなければなりません。プラットフォームの審査基準は著者の創作に影響を与えます;
記事のタイトルに敏感なトピックが含まれている場合、審査時間は大幅に延長され、たとえ審査が通過しても、一度報告されると、プラットフォームはすぐにその記事を削除して自己防衛します。しかし、区块チェーンメディア時代では、分散型、非中央集権の技術により、コンテンツの公開と配信がより公平、公正、客観的になり、誰もが記事を発表でき、誰もが記事に対して評価を行い、誰もが貢献度に応じて利益を得ることができます。
区块チェーン技術の到来は、メディアの発展における痛点を解決し、新しいメディア時代の到来を示唆しています。
自媒体から自ブランド、さらには自商業へ、メディアはブランドの伝播を再構築し、多くの業界の概念を覆し、新しい視野を開きます。
2013-2017 年のクラスタリング状況は図 3-1 に示されており、その中で #7、#8、#9 の三つのクラスタは仮想通貨とその影響に関する議論であり、区块チェーンの初期研究のホットスポットを反映しています。ビットコインの価値の市場変動、通貨の変動が投資家に与える影響、仮想通貨の金融システムにおける地位などの観点から多くの研究が行われました。また、国内で ICO(初回コインオファリング)が禁止されたことも、学界における仮想通貨の法律的側面に関する議論を引き起こしました。
技術的側面では、#0 と #6 の二つのクラスタは区块チェーン技術の研究に密接に関連しています。最初に現れた研究は、暗号学を代表とする情報セキュリティ分野に焦点を当てていました。2013-2014 年の間に、Vitalik Buterin が初めてイーサリアムの概念を提唱し、スマートコントラクトが学界で広く注目され、他の分野への応用の拡張が試みられました。
応用の側面から見ると、#1、#2、#3、#4 の四つのクラスタは、学界が関連分野での探求を反映しています。初期の区块チェーン応用は銀行、保険などの経済金融分野に集中しており、区块チェーンは多くの機関、特に金融機関によって破壊的かつ重要な価値を持つ新興技術として位置付けられ、人工知能やビッグデータなどの技術と並んでいます。
この種のソーシャルネットワークは区块チェーンを使用してソーシャルネットワーク内の情報の公開と伝播を記録し、ユーザーのすべての発言に追跡可能な痕跡を残し、コミュニティ内の質の高いコンテンツの貢献者や伝播者に報酬を与え、偽情報やスパム情報の製作者や伝播者には罰を与えます。これらの特徴により、情報の生産と伝播のコストが高くなり、従来のソーシャルネットワークのユーザーと比較して、この種のソーシャルネットワークのユーザーはコミュニティ内での発言により注意を払い、コミュニティ内で発表されるさまざまな情報をより理性的に見ることができ、新しい情報伝播環境を構築します。
利益 — リスクマトリックスは、区块チェーン環境下のソーシャルネットワークの世論伝播モデルを提案しました。しかし、現在のほとんどの研究は、区块チェーン技術が情報伝播分野での応用の展望や、区块チェーン内の情報伝播の効率を改善し、情報保存のコストを削減することに集中しています。ごく少数の研究が区块チェーンソーシャルネットワークの伝播モデルを提案していますが、これらの研究ではソーシャルネットワーク内の意見対立するグループや異なるインセンティブ政策が各グループの伝播行動に与える影響は考慮されていません。
まず、分散型の分散台帳として、基盤インフラストラクチャのインセンティブ層の技術的特徴により、区块チェーン内の各ノードはデータ検証を行い、合意に達して記帳する必要があります。そのため、区块チェーン内の各ノードの利益を全体の合意と一致させるために合理的なインセンティブ措置を設計する必要があります。この基盤技術の特徴が応用の側面に映し出されるのは、区块チェーン技術に基づくさまざまなソーシャルネットワークプラットフォームが質の高いコンテンツクリエイターや伝播者にプラットフォームの経済トークンを発行してインセンティブを与えることです。これにより、ユーザーは他のユーザーからの認識やトークンのインセンティブをできるだけ多く得るために、自分の意見を表現する際により理性的になります。ユーザーが自分の行動を規範化する一方で、ソーシャルネットワークプラットフォームもトークンのインセンティブ政策を調整することでプラットフォームユーザーを効果的に導くことができます。
次に、区块チェーン技術の基盤インフラストラクチャの合意層は、ブロックの特徴を利用して高度に分散したシステム内で効率的に合意を形成します。伝播の過程で、区块チェーンソーシャルネットワークプラットフォーム内のユーザーは、情報の伝播効果に一定の影響を与えます。ユーザーはプラットフォームのトークンを支払ってコンテンツに投票し、そのコンテンツが質の高い(または低品質の)情報であるかどうか、またそのコンテンツを優先的に表示してより多くのユーザーに見てもらうべきかどうかを評価します。これにより、質の高いコンテンツの伝播が促進され、プラットフォームのトークンインセンティブを得ることができます。
最後に、区块チェーンに保存されたデータは追跡可能で改ざんが難しいです。区块チェーン技術はタイムスタンプとデジタル署名を利用して、区块チェーンに保存された情報の安定性と信頼性を保証します。ユーザーの伝播行動や伝播内容はすべて区块チェーンに保存され、削除することはできません。たとえユーザーが特定の情報のローカル記録を削除しても、その情報は他の分散台帳に記録され続けます。この特徴を利用して、ソーシャルネットワークプラットフォーム上の他のユーザーは、情報を受け取った後、情報を創作(または伝播)したユーザーの過去の発表記録や過去の伝播記録を照会することで、受け取った情報の真実性を初歩的に判断することができます。
区块チェーンソーシャルネットワークにおける情報伝播の実際の状況を仮定します。SNS 内に情報 T(T はあるトピックの支持または反対情報)が存在し、SNS 内のノードを感染しやすいノード S(Susceptible)、観望ノード E(exposed)、賛同ノード A(Advocates)、反対ノード O(Objector)、免疫ノード R(Removed)に分けます。賛同ノード A と反対ノード O は感染者ノード(Infected)と呼ばれます。その中で S ノードはユーザーがまだ情報 T に接触していないことを示します。E ノードは情報 T に接触した後、最大限の経済的利益を得るために一時的に観望状態にあるノードです。A ノードは情報 T に接触した後、情報 T に賛同し、支持情報を伝播するノードを選択します。O ノードは情報 T に接触した後、反対意見を持ち、反対情報を伝播するノードを選択します。R はもはや情報の影響を受けないノードを示します。
SEAOR モデルの状態遷移プロセス Fig.1 SEAOR モデルの状態遷移プロセス
S (k,t)、E (k,t)、A (k,t)、O (k,t)、R (k,t) はそれぞれ t 時刻における k の感染しやすいノード、観望ノード、賛同ノード、反対ノード、免疫ノードの密度を示し、任意の時刻において(k,t)+E (k,t)+A (k,t)+O (k,t)+R (k,t)=1、各状態間の遷移ルールは以下のように説明されます。
-
感染しやすいノード S が目標情報に接触した後、S は確率 psa で賛同ノード A に変わる可能性があり、また確率 pso で反対ノード O に変わる可能性があり、経済的インセンティブや罰則により一時的に観望を選択する可能性があり、確率 pse で観望者ノード E に変わる可能性があります。ここで psa、pso、pse はそれぞれ感染しやすいノード S が情報に賛同する確率、反対する確率、観望する確率です。
-
観望ノード E が再び賛同ノード A または反対ノード O に接触した後、確率 pea で賛同ノード A に変わり、確率 peo で反対ノード O に変わり、また確率 per で免疫ノード R に変わる可能性があります。pae、peo、per はそれぞれ観望ノード E の賛同確率、反対確率、直接免疫確率です。
-
賛同ノード A は確率 par で免疫ノード R に変わります。par は賛同ノード A が目標情報に対する免疫確率です。
-
反対ノード O は確率 por で免疫ノード R に変わります。por は反対ノード O が目標情報に対する免疫確率です。
-
ノードが免疫ノード R になると、その状態は変わりません。
上記の状態間の遷移ルールとシステムダイナミクスに基づき、区块チェーンソーシャルネットワークにおける情報伝播モデルは式 (1) のようになります:
(1)
ここで、pcon はネットワーク内の任意のランダムなエッジが感染者ノードに接続される確率です。
マトリックス内の x は観望者が感染者からのメッセージを受け取る確率であり、すなわち x は pea+peo、1-x は per です。y、z はそれぞれ賛同者と反対者が情報を伝播する確率であり、感染者がもはやメッセージを伝播しない場合、彼らは免疫者に変わります。すなわち 1-y、1-z はそれぞれ pir、por です。
群体 S または群体 E がメッセージを受け取った後、群体 I(A または O)に変わり、投票コスト c を支払い、A と O がすべての I の中での密度(λ と 1-λ)に基づいてコミュニティから提供される経済的インセンティブから基本的な利益 λE、(1-λ) E を得ます。I が健康なノードに成功裏に影響を与え、情報の伝播範囲を拡大した場合、I はその対応する追加の利益を得ることになります。同時に、I が伝播するメッセージは低品質のコンテンツと見なされる可能性があり、I は相応の経済的罰則を受けるリスクがあります。
uE1=(yλ-zλ+z)E-(y+z)c
(2)uE2≡0
観望者 E が「受け入れる」戦略を取る確率の複製動的方程式を構築します [15]
(5)F(x)=x(1-x)[(yλ-zλ+z)E-(y+z)c]
(6)
-
(1) もし (yλ-zλ+z) E-(y+z) c=0 であれば、F (x)≡0、すなわち観望者 E が「受け入れる」と「受け入れない」戦略の比率がどうであれ、その戦略は時間とともに変わらなくなります。この時、per と pea+peo は不変です。
-
(2) もし (yλ-zλ+z) E-(y+z) c≠0 であれば、F (x)=0 とすると、x=0、x=1 が x の二つの安定点となります。すなわち、選択が反対の戦略の突然変異体が出現しない限り、観望者 E が特定の戦略を選択する比率(「受け入れる」または「受け入れない」に安定する)はもはや変わらなくなります。この時、F (x) を微分すると次のようになります。
遷移確率 per、par、por の t 時刻における変化傾向と関数を導出できます。上記のゲームの参加者は観望者 E と全ての感染者であるため、上記の計算だけでは観望者 E が「受け入れる」戦略を選択した場合の遷移確率 pei と peo の変化傾向を特定することはできません。E が「受け入れる」戦略を選択した場合:(1) もし E が A が伝播する情報を受け入れることを選択した場合、ゲームマトリックスからその利益は λE-c であることがわかります;(2) もし E が O が伝播する情報を受け入れることを選択した場合、ゲームマトリックスからその利益は (1-λ) E-c であることがわかります。
λ は A が現在すべての感染者の中での密度であり、(1-λ) は O が現在すべての感染者の中での密度です。したがって、E が「受け入れる」戦略を選択する条件下で、その利益は A、O がすべての感染者の中での密度に関連しており、選択人数が多い方が E は常により高い利益を得ることができます。これは、ある程度、実際のソーシャルネットワークにおいて個体が大衆の信念に直面した際に自分の疑念を抑え、知識を持ちながらも偽装する現象を反映しています。この現象は同調効果と呼ばれます [16]。万佑紅らは [17]、情報の初期伝播率とある時点での伝播者の密度を組み合わせて同調効果が情報伝播確率に与える影響を説明しました。上記の既存の研究に基づき、この記事の実際に基づいて、E が「受け入れる」戦略を選択した条件下で、遷移確率 pea と peo の動的変化方程式を導出します。
区块チェーンソーシャルネットワークにおけるインセンティブメカニズムとソーシャルネットワークに普遍的に存在する同調心理が、区块チェーンソーシャルネットワーク内の異なるグループの伝播行動に影響を与えることがわかります。ユーザーの期待利益は基本利益 E、伝播コスト c、伝播罰則リスク R、伝播追加利益に関連しており、異なる感染者の密度がその基本利益と追加利益に影響を与えます。したがって、上記のパラメータを調整することで、各グループの密度変化に影響を与えることができます。情報伝播の時間が比較的短いため、今後の実験ではネットワーク規模の動的変化は考慮しません。
群体 E、A、O の伝播利益は常にその伝播リスクよりも大きいため、群体 A、O の密度は短時間で上昇し、下降することはなく、最終的に定常状態に達します。
インセンティブ政策を調整し、群体 E、A、O の伝播利益が 0 より大きくなるか小さくなるようにし、各群体の変化傾向は図 6 に示されています。
区块チェーンソーシャルネットワークがユーザーに提供する経済的インセンティブは、ソーシャルネットワーク内のユーザーの伝播行動に深く影響を与えることができます。経済的利益はユーザーの情報伝播への熱意を大いに刺激し、インセンティブと共存する経済的罰則メカニズムは、ユーザーが異なる情報に直面した際に理性的かつ懐疑的であり、偽情報や低品質情報を軽々しく信じないようにします。実際の世論監視において、プラットフォームは異なる状況に応じてインセンティブ政策を調整し、高品質のコンテンツを際立たせ、低品質の情報の伝播を抑制することで、より積極的で健康的なネットワーク世論環境を醸成することができます。
コンテンツ推薦のための Sean モデルが提案され、区块チェーンソーシャルプラットフォーム Steemit 上で構築されたデータセットと CF アルゴリズムなどの他のコンテンツベースの推薦方法と比較され、良好な結果を得ました [ 26 ]。この記事では、公開された Steemit ユーザー関係データセットを使用して複雑なネットワークを構築します。ネットワークトポロジーは図2に示されています。この図には 7242 のノードと 273942 のエッジが含まれています。ノードの色とサイズはノードの次数を表します。ノードの色が濃く、サイズが大きいほど、ノードの次数は大きくなります。
ソーシャルネットワークはインセンティブメカニズムを使用して高品質の情報を際立たせ、低品質の情報を抑制します。ある程度、区块チェーンソーシャルネットワークはそのインセンティブメカニズムを利用してユーザーに低品質情報の伝播を抑制するよう促すことができます。抑制効果は、情報が最大の伝播範囲に達したときの異なる情報伝播者の密度差で表すことができます。モデルがこの効果を説明できるかどうかも、モデルの合理性を評価する指標の一つです。区块チェーン環境下では、経済的インセンティブにより、ユーザーは伝播行動を選択する際により慎重になり、情報を受け取ったら無造作に伝播することはありません。一方で、ユーザーが特定の意見に頻繁に接触する場合、彼らはその意見を伝播することを選択する傾向があります。したがって、伝播の開始時にさまざまな伝播者の比率が、ユーザーが情報に接触した後の伝播行動に重要な影響を与えることがわかります。この記事では、異なるタイプの伝播者の初期密度比を選択し、情報が最大の伝播範囲に達したときの異なる情報伝播者の密度差を観察します。この記事のモデルと従来の通信モデルの比較は図に示されています。この記事では、異なるタイプの伝播者の初期密度比を選択し、情報が最大の伝播範囲に達したときの異なる情報伝播者の密度差を観察します。この記事のモデルと従来の通信モデルの比較は図に示されています。この記事では、異なるタイプの伝播者の初期密度比を選択し、情報が最大の伝播範囲に達したときの異なる情報伝播者の密度差を観察します。
コアユーザーの識別に加えて、伝播規模も微博の最終的な伝播効果に影響を与える重要な要素の一つです。情報伝播規模の予測を通じて、情報伝播の最終的な影響範囲を早期に発見することができます。関連研究は情報伝播モデリング、影響力の最大化などの側面に集中しています。
まず、この記事では微博ネットワーク内の完全なリツイートリンクを分析し、コアユーザーの識別を定義しました。
次に、この記事では微博ネットワーク内の関連特徴を抽出し、リツイートに影響を与える要因を総合的に分析し、リツイート要因のユーザー影響力や情報強化効果を考慮し、線形閾値モデル(LT)、感染症モデル(SEIR)を初期の基盤として、単一の微博の最終的な伝播規模を予測するための閾値表現方法を改善しました。
フォロー関係はそのソーシャルネットワーク構造の重要な構成要素であり、ユーザー間のフォロー関係はネットワーク構造の入度と出度を共同で構成します。88829 件のユーザーのフォローデータを分析した結果、以下の発見がありました(付録 Ⅱ(1)):
-
8420 人(10%)が 993 人以上をフォローしており、データを収集した際の最大フォロワー数は 993 でした。
-
多くのユーザーは 100〜200 の範囲でフォロー数が多く、一般的な論理に合致しています。なぜなら、大多数の人はソーシャルな事務処理にかけるエネルギーが限られているからです。
二つのネットワークと四つの指標を展開します。コアユーザーは異なるシーンで異なる定義を持つことを考慮し、情報伝播の状況において、この記事ではユーザーの微博拡散能力や下位ユーザーへの影響力を測定指標としてコアユーザーのコア度を計算します。具体的には PageRank の考え方を利用し、微博リツイート関係ネットワークやユーザーのフォロー関係ネットワークを基に、情報リツイートの時間性、ユーザーのリツイート影響力、下位ユーザーの感情の強さへの影響、静的ネットワーク内のユーザー自身の位置情報指標を基にユーザーのコア度を決定します。
-
テキストを分割し、テキスト内の感情語、否定語、程度副詞を見つけます;
-
各感情語の前に否定語や程度副詞が存在するかどうかを判断し、それらを感情語と一緒にテキスト内の一つのグループに分けます;
-
感情語の前に否定語があれば、その感情語の感情値を - 1 倍し、程度副詞があれば程度副詞の程度値を掛けます;
-
すべてのグループのスコアを合計し、ポジティブな感情スコアが 0 より大きく、ネガティブな感情スコアが 0 より小さく、絶対値が大きいほど感情が強いことを示します。
度アルゴリズム:ソーシャルネットワークにおける情報伝播プロセスに基づいて:
-
リツイート影響力:リツイートされたユーザーの情報伝播能力をトピック内での情報伝播の広がりとして示します。
-
ユーザー自身の質:ユーザーの情報伝播能力がユーザーの強度に影響を与えることを示します。
したがって、この記事ではこれら二つの測定指標を線形融合して、ユーザーのトピック内での情報伝播能力の大きさを計算します。
古典的な伝播理論は、情報の伝播を「大衆伝播」と「人際伝播」に分けることができると考えています。社会ネットワーク分析(SNA)手法の発展に伴い、情報伝播規模の予測に過度に「構造化」現象が見られます(6)、すなわちネットワーク構造を過度に強調し、情報伝播のマクロ性を無視しています。個体間の相互作用は最終的な伝播規模に重要な影響を与え、ネットワーク構造の役割を誇張することは、しばしば実際の状況に反します。
「非構造化伝播」と「構造化伝播」の境界がより曖昧になります。
以下の仮定を満たします:
-
仮定 1:ユーザーが発表またはリツイートしたユーザーの状態は感染ユーザーであり、その直接のフォロワーの状態は感染しやすいユーザーです。
-
仮定 2:微博ユーザーが感染しやすいユーザーから感染ユーザーになる確率は β です。
-
仮定 3:ユーザーが感染状態から免疫状態になる確率は α です。
-
仮定 4:これらの感染ユーザーをフォローしていないユーザーの状態は外部ユーザーです。このようなユーザーは自主的に微博を読み、リツイートする確率は γ です。
特定のホットトピックが与えられ、信頼のサークルがあり、時刻 t において、SIRE モデルでは:
-
S (t) は時刻 t における感染しやすいユーザーの数を示し、この部分の人々はリツイートを行う可能性があります;
-
I (t) はこの微博をリツイートしたユーザーを示し、伝播力を持つ人々です;
-
R (t) は免疫ユーザー R の数を示し、このユーザーは時刻 t においてこの微博をリツイートしないユーザーの人数を示します。
この記事では、フォロー関係、ユーザー影響力、情報強化効果に基づく伝播規模予測モデルを提案します。このモデルは線形閾値モデル(LT)(11) を基にし、異なるユーザー影響力を重視しています。このモデルは二つの部分に分かれており、起動部分とその後の伝播部分です。起動部分では、元の微博ユーザー u がフォロワー集合 fans (u) に与える影響力 PR (u) を考慮し、ユーザー v のリツイート閾値を 0 からそのフォロワーがすべてフォローしているユーザー(Fv)の PR 値の合計までのランダム数に設定します。すなわち、γv∈[0,sum (PR (Fv))]、もし PR (u)>γv であれば、ユーザー v はリツイートしません;もし PR (u)≤γv であれば、ユーザー v はリツイートします。後続の伝播部分では、情報の冗長性により強化効果が存在し、ユーザーの総影響力 Influce (v) は以下のように計算されます:
v のリツイート閾値は 0 からそのすべてのフォローユーザー(Fv)の PR 値の合計までのランダム数に設定され、LR モデルとは異なり、v がフォローしているユーザーの 90% 近くがこの情報をリツイートした場合、ユーザー v は必ずリツイートに参加します。
リンク予測の主な目的は、ネットワークノード間にリンクが存在する確率を推測することです。この記事では、リツイート関係に基づく微博伝播ネットワークにおけるリンク予測問題を主に研究します(付録 Ⅳ(1))。
この記事ではリツイートデータを用いてさまざまな指標を比較分析し、データを 0.85:0.15 の比率でトレーニングセットとテストセットに分割します。Adamic-Adar、Jaccard Coefficient、Preferential Attachment、Node2vec、Variational Graph Auto-Encoders などのリンク予測手法をそれぞれ試み、リンク予測アルゴリズムの精度を測る指標は主に AUC と Precision です。AUC は全体的にアルゴリズムの精度を測定し、Precision は上位 L 位のエッジが正確に予測されているかどうかのみを考慮します。