banner
leaf

leaf

It is better to manage the army than to manage the people. And the enemy.
follow
substack
tg_channel

ユーザー画像はこんなに重要です!では、ユーザー画像のプロセスや方法はどのようなものですか?

ユーザー画像という概念は、インタラクションデザインの父であるアラン・クーパーによって提唱されました。彼は、ユーザー画像は実際のユーザーの仮想的な代表であり、一連の実データに基づいて構築されたターゲットユーザーモデルであると述べています。ユーザー画像を覚えておくことは、仮想的な代表を使って私たちの大部分のユーザーを表現することです。情報分析者の小編が言いたいことをもっと直接的に言うと、創業者はどのようにユーザー画像を作成するか、皆さんが覚えておくべきことは、私の重要なユーザー、コアユーザーがどのようなものであるかを知ることです。彼らは男性か女性か、何が好きなのか?あるいは、あなたのコアユーザーを一言で表現できるかどうか、ユーザー画像は、さらにはインターネット企業の核兵器です。

例えば、テンセント、バイドゥ、アリババのこの 3 社は BAT と呼ばれています。BAT の最も核心的な能力は、私が考えるにビッグデータのユーザー画像能力です。もう一つの話をしましょう。皆さんもご存知の通り、テンセントは製品を作るのが非常に得意です。もしあなたが製品を作り、テンセントに目を付けられたら、テンセントも製品を作り、すぐにあなたを超えてしまうことができます。なぜでしょうか?それは、テンセントが非常に強力なユーザーの掘り起こし能力を持っているからです。

例を挙げると、テンセントの技術は T1、T2、T3、T4、T5 に分かれています。T5 はチーフサイエンティストに相当し、基本的には一人か二人です。T4 にはテンセントに多くの人がいて、数十人います。T4 とは何か?テンセントが T4 専門家グループと呼ぶもので、テンセントが T4 に入ることができるのは、一般的に数億回のユーザー運営を経た技術の達人です。テンセントが問題に直面したときは、T4 専門家グループに頼り、このユーザー画像に精通した T4 専門家グループに助けを求めます。

ユーザー画像はこれほど強力で、核兵器のようなもので、ここで第二の核心点について話しましょう。どうやってやるのか?創業者は、彼自身がプロダクトマネージャーではない場合、どのようにユーザー画像をうまく作成するのでしょうか?それは、シードユーザーを見つけることです。

多くの人がシードユーザーとは何かと言います。ユーザーは階層的に分かれており、ターゲットユーザーが何であるかを知っている必要があります。ターゲットユーザーの中にはコアユーザーがいます。コアユーザーの中には何があるのでしょうか?それがシードユーザーです。シードユーザーはまるで種のように、ユーザーの中の意見リーダーであり、彼らはユーザーの中で発言権を持つ人々であり、コアユーザーの中の鍵となる存在です。

ユーザー画像を作成するには、必ずシードユーザーを見つけなければなりません。製品を作る際にもシードユーザーを見つける必要があります。皆さんもご存知の通り、シードユーザーはほぼすべての企業が製品を作る際の第一歩です。例えば、小米のシードユーザーは何でしょうか?小米は現在、中国国内で非常に多くのスマートフォンを販売している企業であり、小米のシードユーザーは熱心なファンです。

しかし、Huawei の販売台数も国内でトップクラスです。では、Huawei の主流ユーザーは何でしょうか?小米と同じですか?違います。Huawei のシードユーザーはビジネスエリートです。

次に OPPO を見てみましょう。OPPO の販売台数も国内でトップクラスです。OPPO のユーザー画像は彼らと同じですか?違います。OPPO のユーザー画像は若い女性です。ですので、シードユーザーを見つけることが非常に重要です。シードユーザーが天下を取るのです。

image

image

image

一、ユーザー画像とは何か

image

image

image

ユーザー画像は、一連の実データに基づいて構築されたターゲットグループのユーザーモデルであり、ユーザーの属性や行動特性に基づいて、相応のラベルを抽象化し、フィットさせた仮想的なイメージです。主に基本属性、社会属性、行動属性、心理属性を含みます。

注意すべき点は、ユーザー画像は共通の特徴を持つユーザーをクラスタリング分析した結果であり、特定の個人に対してではないということです。

image

image

ユーザーラベルの集合

image

image

image

二、ユーザー画像のステップ

image

image

image

(1)画像の目的を明確にする

画像の目的を確認することは非常に基本的であり、重要なステップです。ユーザー画像を構築する際に、どのような運営やマーケティング効果を期待しているのかを理解し、ラベル体系を構築する際にデータの深さ、広さ、タイムリーさについて計画を立て、基盤設計が科学的かつ合理的であることを確保します。

(2)データ収集

客観的で実際のデータに基づいて構築された画像のみが有効です。データを収集する際には、業界データ、全ユーザーの全体データ、ユーザー属性データ、ユーザー行動データ、ユーザー成長データなど、さまざまな次元を考慮し、業界調査、ユーザーインタビュー、ユーザー情報の記入およびアンケート、プラットフォームのフロントエンドおよびバックエンドデータ収集などの方法を通じて取得します。

(3)データクレンジング

収集したデータには、ターゲットでないデータ、無効なデータ、虚偽のデータが存在する可能性があるため、原始データをフィルタリングする必要があります。

(4)特徴エンジニアリング

特徴エンジニアリングは、原始データを特徴に変換することができる、いくつかの変換と構造化の作業です。このステップでは、データ内の異常値(例えば、e コマースアプリで、ユーザーが数分で数セントの価格でスマートフォンを取得することができるが、ユーザーの日常の買い物の単価は千元以上である)を除外し、データを標準化(消費者が買い物に使用する通貨には人民元と米ドルが含まれるため、通貨を統一する必要があります)し、判断のラベルを標準化する必要があります。

画像構築に使用される技術には、データ統計、機械学習、自然言語処理技術(NLP)などがあります。具体的な画像構築方法は、本章の後の部分で詳細に説明します。

image

ユーザー画像の構築技術

(5)データのラベル付け

このステップでは、得られたデータを構築したラベルにマッピングし、ユーザーのさまざまな特徴を組み合わせます。ラベルの選択は、最終的な画像の豊かさと正確さに直接影響を与えるため、データのラベル付けを行う際には、アプリ自体の機能と特徴と結びつける必要があります。例えば、e コマースアプリは価格感度に関連するラベルを詳細化する必要がありますが、情報系ではできるだけ多くの視点からラベルを使用してコンテンツの特徴を説明する必要があります。

image

優先順位付けの方法は、構築の難易度と各種ラベルの依存関係に基づいており、優先順位は図のようになります。

image

各種ラベルの構築優先順位

(6)ユーザー画像の構築

ラベルを 3 つのカテゴリに分けます:

第一のカテゴリは人口属性

人口属性には、年齢、性別、学歴、人生の段階、収入レベル、消費レベル、所属業界などが含まれます。

性別

男性

女性

不明

年齢

12 以下

12-17

18-19

20-24

25-29

30-34

35-39

40-44

45-49

50-54

55-59

60-64

65 以上

不明

月収

3500 元以下

3500-5000 元

5000-8000 元

8000-12500 元

12500-25000 元

25001-40000

40000 元以上

不明

婚姻状況

未婚

既婚

離婚

不明

業界

広告 / マーケティング / PR

航空宇宙

農林化学

自動車

コンピュータ / インターネット

建設

教育 / 学生

エネルギー / 採掘

金融 / 保険 / 不動産

政府 / 軍事 / 不動産

サービス業

メディア / 出版 / エンターテインメント

医療 / 保険サービス

製薬

小売

通信 / ネットワーク

旅行 / 交通

その他

教育レベル

中学校以下

高校

専門学校

短期大学

大学

修士

博士

人口ラベル

第二のカテゴリは興味属性

ユーザーの興味画像を構築する前に、ユーザーの行動内容に対してコンテンツモデリングを行う必要があります。興味画像が一定の正確性を持ち、かつ良好な一般化性を持つことを保証するために、階層化された興味ラベル体系を構築し、同時にいくつかの粒度のラベルを使用してマッチングを行い、ラベルの正確性と一般化性を保証します。

階層化された興味ラベルをどのように構築するか?一般的には、ユーザーがどのようなコンテンツや事物に興味を持っているかを見て、興味のあるコンテンツや事物を抽出、ラベル付け、統計を行います。

第三のカテゴリは地理属性

常駐地の掘り起こしは、ユーザーの IP アドレス情報に基づいており、ユーザーの IP アドレスを解析し、対応する都市にマッピングし、ユーザー IP が出現した都市を統計することで常駐都市ラベルを得ることができます。

ユーザーの常駐都市ラベルは、各地域のユーザー分布を統計するだけでなく、ユーザーが各都市間を移動する軌跡に基づいて出張者や観光客などを識別することもできます。以下の図は、人々の移動軌跡の一例です。

image

人々の移動軌跡

GPS データは通常、モバイル端末から収集されますが、多くのモバイルアプリはユーザーの GPS 情報を取得する権限を持っていません。ユーザーの GPS 情報を取得できるのは、主に百度地図、滴滴打車などの移動ナビゲーションアプリです。また、収集されたユーザーの GPS データは比較的希薄です。

百度地図はこの方法を使用して、時間帯データと組み合わせてユーザーの会社と自宅の GPS ラベルを構築しました。さらに、百度地図は GPS 情報に基づいて、各道路の車両流量を統計し、交通状況を分析しています。以下の図は北京市のリアルタイム交通状況図で、赤色は混雑した道路を示しています。

image

北京のリアルタイム交通状況図

(7)画像の生成

データがモデル内で実行された後、最終的に生成された画像は、以下の図のような可視化形式でユーザー画像を示すことができます。ユーザー画像は一成不変ではなく、モデルは一定の柔軟性を持ち、ユーザーの動的行動に基づいて画像を修正および調整する必要があります。

image

情報収集#

プライバシー#

パケットキャプチャ情報

積極的に参加しているトピック(社会的事件に関する議論や経験)

好んで使用する絵文字や emoji、参加しているグループやチャンネル

発言(身分、生活、職業、生活習慣、単位、愚痴、収入、価値観、立場など)

文体(表現方法、文の構造、句読点など)

スクリーンショットの内容(フォント、アプリのページ、上部通知バーのアイコンなど)

共有リンクや画像(参考)

写真(人、物、場所、象徴的な物体、天候、光照、身分情報など)

社会的活動の写真(名称、開催時間、ポスター、スローガン)

地域特性(特産物、タバコ、トーテム、植物、地形)

音声(アクセント、方言、年齢、環境雑音)

共有ファイル(メタデータ、隠しウォーターマーク、元画像の exif 情報、ファイルの出所、内容)

アカウント情報(アバター、ユーザー名、署名 / プロフィール、パスワード、異なるプラットフォームで同じ情報を使用)

(国内のさまざまなプラットフォームが徐々に IP の属地情報を表示し始めており、全体的に見て、これらの属地を表示する製品のドメイン名を収集するプロジェクトはないでしょうか?それを一括コピーして追加することでプライバシーを保護することができるのでしょうか?)
解決策👇

Bilibili IP 位置情報インターフェース#

host, api.bilibili.com, Location IP

Zhihu IP 位置情報インターフェース#

ip-cidr, 103.41.167.0/24, Location IP

Weibo IP 位置情報インターフェース#

host-suffix, api.weibo.cn, Location IP

Tieba IP 位置情報インターフェース#

host,www.baidu.com,Location IP

Toutiao IP 位置情報インターフェース#

host-suffix,toutiaoapi.com, Location IP

Douyin IP 位置情報インターフェース#

host-keyword,core-c-lq,Location IP
host-keyword,core-lq, Location IP
host-keyword,normal-c-lq, Location IP
host-keyword,normal-lq, Location IP
host-keyword,search-quic-lq, Location IP
host-keyword,search-lq, Location I

1 枚の写真で具体的な位置を推測する方法|ネット迷踪入門ガイド#

前書き#

本格的なチュートリアルを始める前に、いくつかの点を説明する必要があります:

  1. この記事では、「ネット迷踪」と呼ばれる、1 枚の写真と限られたヒント情報だけで写真が撮影された具体的な場所を推測する推理ゲームについて紹介します。これは、合法的に公開されているリソースからデータや情報を収集する行為であるオープンソースインテリジェンス(Open-Source Intelligence, OSINT)[1]の一形態と見なすことができます。
  2. この記事では、「場外情報」を取得し分析する方法、例えば「地元の人ならすぐにわかる」や、出題者の過去のコンテンツやソーシャルメディアからその身元や居住地情報を取得する方法については紹介しません。この文章では、「ネット迷踪」において「人肉検索」など、他人のプライバシーを侵害する行為を使用することを奨励していません。
  3. 著者自身は「ネット迷踪」の愛好者であり、本文で言及されているソーシャルメディアやツールとの間に利益関係はありません。また、著者はアマチュアプレイヤーであり、以下の内容は個人的な経験のまとめであり、厳密で専門的なチュートリアルではありません。この文章がこのゲームに興味を持つ一部の人々の入門を助け、同時に公開チャネルで写真を投稿することによってもたらされるプライバシーリスクに気づく手助けとなることを願っています。

1 枚の写真で、あなたがどこにいるかを知ることができる?|ネット迷踪の初探「ネット迷踪」は、オープンソース調査の中で最も影響力のある形態の一つであり、非常にドラマチックに見えます:1 枚の画像で正確に位置を特定できます。しかし、このドラマチックさは、人々が 1 枚の画像が含む情報量や、インターネットのオープンソース情報の規模と広がりを過小評価していることに起因しています。

編注:この記事は「一般の人が 1 枚の写真を通じて現実の場所を逆推測するプロセス」を普及させることを目的としており、読者に警鐘を鳴らすことを期待しています。読者がこの記事に基づいて探索や研究を行う場合は、他人のプライバシーや関連法規を尊重することに注意してください。

2011 年、「私はどのように王珞丹の住所を推測したか?」というタイトルの投稿が大々的に転載されました。投稿者は、王珞丹のいくつかの微博、北京の知識、Google Earth を利用して、40 分で王珞丹の前の住所を推測しました。(王珞丹は当時人気の職場ドラマ「デュラララの昇進記」の主演であり、著者の年齢を暴露する人気女優です。)GGMM たちは「すごい」と驚きつつ、自分も調査されるのではないかと心配し、二度とネットに何かを投稿しないと誓いました。

image

関連報道。画像出典:搜狐传媒

10 年後の 2021 年、多くの愛好者やクリエイターの紹介を受け、「ネット迷踪」と呼ばれる探偵ゲームが一般の視野に入ってきました。1 枚の画像とわずかなヒントの条件下で、達人たちは単にインターネットに接続されたコンピュータを使って、画像が撮影された場所を見つけることができるようになりました。現在のネットユーザーたちは「すごい」と驚きつつ、自分も調査されるのではないかと心配し、再びネットに何かを投稿しないと誓いました。

image

炒飯コミュニティのネット迷踪セクション。画像出典:炒飯コミュニティ

image

Bilibili の UP 主「私は EyeOpener」は、影響力のあるネット迷踪の紹介者の一人です。画像出典:bilibili

インターネットの歴史は「循環の繰り返し」ですが、循環は螺旋的に上昇しています。10 年間で、世界のインターネットユーザー数は倍増し、ウェブページの数は 4 倍になりました。私たちはあまり進歩していないかもしれませんが、この調査技術は膨大なインターネット情報の支えを受けて、ますます成熟しています。その正式な名前はオープンソース調査(Open Source Investigations, OSI)またはオープンソースインテリジェンス(Open Source Intelligence, OSINT)[2]であり、インターネット上のオープンソース情報を利用して調査を行う技術を指します。

「ネット迷踪」はオープンソース調査の中で最も影響力のある形態の一つであり、非常にドラマチックに見えます:1 枚の画像で正確に位置を特定できます。しかし、このドラマチックさは、人々が 1 枚の画像が含む情報量や、インターネットのオープンソース情報の規模と広がりを過小評価していることに起因しています。あなたは自分の写真がプライバシーを暴露することを心配していますか?探偵たちがどのように糸を解いて撮影者の位置を導き出すのか興味がありますか?今日、この記事を通じて、あなたもネット迷踪の神秘のベールを剥がし、ネット探偵になり、自分自身のネットコンテンツの安全専門家になることができます。

ネット迷踪の遊び方#

炒飯コミュニティは、掲示板のような興味を集めるソーシャルサイトであり、そのネット迷踪セクションは業界内で非常に影響力があります。毎日、多くの友人たちがここに自分が撮影した写真を投稿し、「探偵たち」に挑戦を発信しています。モデレーターチームは定期的にネット迷踪のポイント競技を開催し、勝者には素敵なトロフィーが贈られます。(広告ではありません、特に声明します。)

image

炒飯コミュニティのネット迷踪セクションの内容。画像出典:炒飯コミュニティ

すべての画像が謎解きに適しているわけではありません。炒飯コミュニティでは、謎解き画像は都市の建物、交通手段(特に飛行機や新幹線)、道路、観光地などのいくつかのカテゴリに集中しており、主に遠景が中心です。自分の机の上の置物や、道端の小さな花や草の写真を撮った場合、探偵たちは画像の内容から有効な情報を得ることは非常に難しいです。

ネット迷踪の謎は、パノラマ画像や動画などのマルチメディア形式でも可能です。少数派が紹介したGeoGuessrや、百度地図が提供する「パノラマ都市探検家」などは、パノラマ画像を媒体としたものです。

ネット迷踪の基本的な考え方は、以下の 3 つのステップに分けることができます:

  • 抽出:画像を注意深く観察し、すべての有効な情報を抽出します。どんなに小さくてぼやけていても見逃してはいけません;
  • 分析:自分の知識とインターネットツールを利用して得られた情報を分析し、調査範囲を絞ります;
  • 検証:インターネットツールを使って調査を展開し、分析段階で得られた調査範囲を検索します。成功しなかった場合は、最初の 2 つのステップに戻って再試行します。

情報の抽出と分析はネット迷踪の鍵であり、その楽しさでもあります。これは探偵たちの広範な知識、強力なインターネット情報検索能力、長期的な経験の蓄積に依存しています。

ネット迷踪の探偵は、論理的推理を通じて答えを導き出すことを好み、推理プロセスが難しいほど、答えを導き出す達成感が強くなります。現実の複雑性を考慮すると、この推理プロセスは厳密ではなく、むしろ生活経験に基づく大まかな推測に過ぎません。

画像に隠されているものは?#

合格したネット迷踪の探偵になるための第一歩は、画像を見て、隠された情報を掘り起こすことです。一般的に、1 枚の画像には以下の情報が含まれる可能性があります:文字情報、基盤施設情報、自然地理情報。

文字情報#

文字情報は、地理的位置を推測する最も迅速で簡単な方法です。他の種類の情報と比較して、文字情報には大きな利点があります:

  • 位置を直接示す可能性がある:道路標識、政府機関の建物、駅名、番地などの文字情報は地理的位置と強く関連しており、簡単に得点問題になります。
  • 専門的なハードルがない:植物の品種や飛行機のモデルを特定するためには一定の専門知識や比較分析プロセスが必要ですが、文字情報を解読するにはそれらは必要ありません。文字を認識できれば十分です。
  • 検索が容易:文字を直接検索エンジンで検索できます。多くの検索エンジンは画像検索をサポートしていますが、その正確性は文字情報には及びません。

したがって、ネット迷踪の探偵は、画像中の文字情報を見逃すことはありません。たとえそれがぼやけていても、識別を試みます。

例えば、以下の画像を見て、撮影者の位置を尋ねるとします:

image

これは沙県小吃店です。しかし、「沙県小吃」を直接検索するのは良いアイデアではありません。全国に沙県小吃店は数万軒あります。画像の詳細を注意深く観察すると、いくつかの文字情報が見つかります:隣の「* 記」、窓の反射に「王府」「旺基」、番地「香榭 」「23」、電動バイクの泥除けに「星橋モラカ専売店」の広告があります。

image

電動バイクは都市間を跨ぐことは少ないため、そのナンバープレートと泥除けの広告から撮影地の都市を推測できます。ナンバープレートの都市名はぼやけており、2 文字しか見えないため、泥除けから始めます。

全国で「星橋」を検索し、「三星大橋」などのあいまいな一致を除外すると、残る可能性のある項目は 12 個です:浙江省杭州市星橋街道、湖州市星橋村、福建省三明市星橋村、福清市星橋村、四川省資陽市星橋村、広安市星橋村、広元市星橋村、重慶市星橋町、雲南省麗江市星橋村、湖南省邵陽市星橋村、株洲市星橋村、湖北省咸寧市星橋村。窓の反射から見ると、この場所は商業活動が活発で、普通の農村のようには見えません。

image

全国の「星橋」(一部)。画像出典:百度地図

広告には「モラカ専売店」の電話番号が記載されています。ご存知の通り、我が国の電話番号の最初の 3 桁は通信事業者を示し、中間の 4 桁は地域コードですので、電話番号の最初の 7 桁で番号の帰属地を特定することができます。これは必ずしも撮影者の所在地であるとは限りませんが、大まかに言って本当です。

image

電話番号はぼやけており、最初の 7 桁の中で見える数字は「1508*64」であり、5 桁目は 3、5、または 8 のように見えます。調べてみると、1508364 は江西省新余、1508564 は貴州省遵義、1508864 は浙江省杭州に属します。星橋の検索結果と照らし合わせると、杭州市にのみ重なります。したがって、撮影者が杭州にいると仮定し、次の検索に進みます。

次に、番地「香榭 」「23」に注意を向けます。番地の内容は道路名、小区名、村名である可能性があります。近くに商業施設が密集していることを考えると、ここは道路名である可能性が高いです。「香榭」の後の内容は隠れており、比率の位置から見ると、まだ一文字残っているはずで、「路」や「街」といったものでしょう。

image

杭州市で「香榭路」を検索すると、実際に香榭という名前の道路が見つかり、星橋街道に属します。

image

杭州市星橋街道香榭路。画像出典:百度地図

この地域で沙県小吃を検索すると、「疑似ターゲット」となる店舗が見つかります:

image

疑似沙県小吃店。画像出典:百度地図
image

残念ながら、ストリートビューは古く、画像に似た店舗は見つかりませんでした。しかし、建物のスタイルや道路標識の形式は一致しています。

image

香榭路全景図。画像出典:百度地図

美団でこの店舗を見つけることができ、番地は「香榭路 23-1」であり、店舗の画像は謎解き画像と一致しています。これで、撮影者の位置が浙江省杭州市臨平区香榭路 23-1 の沙県小吃の近くであることが確定しました。

image

沙県小吃天都城店。画像出典:美団

以上がネット迷踪の得点問題の一例であり、文字情報を分析するだけで答えを導き出すことができました。

基盤施設情報#

大きな都市から小さなゴミ箱まで、基盤施設は多岐にわたり、市政、交通、建築などの分野を含みます。基盤施設に基づいてネット迷踪を展開する理論的根拠は以下の 2 点です:

  • 識別可能性。工業社会の産物として、同じ機能の基盤施設は外観が大同小異であり、「これは何か」を識別することができます。港、空港、スタジアムなどの大型施設を特定することは、位置を特定する上で重要な役割を果たします。
  • 地域差異性。国や地域の政策、気候条件、経済地理条件の影響を受け、基盤施設同士には差異が存在します。これにより、「ここはどこか」を推測することができます。

一般的に使用される基盤施設情報を簡単に列挙します:

  • ランドマーク建築:ランドマーク建築は一般に独特の特徴を持ち、画像検索を通じて都市を特定することができます。もし模倣者であれば、ニュース報道を利用することも難しくありません。
  • 都市部:中心都市、城中村、都市と農村の接合部のスカイラインやバードアイビューはそれぞれ異なり、都市の規模の大小もこれらの都市景観に影響を与えます。
  • 住宅:住宅は一般に北を向いて南に座っており、方向を判別するために使用できます。各地の農村の民家には異なるスタイルがあり、赤瓦の尖った屋根、粉色の壁、黛瓦、窑洞、四合院などがあり、所在地域を推測することができます。
  • 道路:異なるタイプの鉄道や道路にはそれぞれ特有の施設があり、鉄道の接触網、護岸、隔離網などがあります。鉄道駅、道路料金所、立体交差、交通標識なども重要な手がかりです。独特のスタイルの街灯も解決の突破口になる可能性があります。
  • 車両:ナンバープレートは所在国を推測するのに役立ち、一部はさらに行政区にまで正確に特定できます。自動車が左側通行の場合、右側通行の国を排除できますし、その逆も同様です。都市のバスやタクシーは通常、統一または系列の塗装を使用しています。
  • 列車、飛行機:列車や飛行機の外観の詳細に基づいて、そのモデルを特定できます。列車や飛行機の便名はオンラインで確認できます。特別な塗装も重要な情報を明らかにすることがあります。飛行機の写真の撮影角度に基づいて、飛行機が離陸または着陸しているかを大まかに判断できます。
  • 特殊施設:気象観測所、レーダー基地、スタジアム、港などには特殊な施設があり、スタジアム専用の照明灯や港のクレーンなどがあります。これらの特殊施設を識別するには関連知識が必要です。

基盤施設情報はネット迷踪で最も一般的で主要な情報の種類であり、本文ではすべてを網羅することはできませんが、ここでは基盤施設情報に基づいて位置を特定する典型的なケースを紹介します。これはオープンソース情報の専門家NixIntel のブログからのものです。この専門家のブログは国内のネット迷踪ブロガーに豊富な素材を提供しています。

image

第二の謎の画像、画像出典:Swapfiets会社

これは Swapfiets 会社が発表した広告写真で、写真の位置を探す必要があります。NixIntel は画像から以下の情報を抽出しました:

  • これは高層ビルのある都市です。
  • 道路の軌道は、その都市がトラムを運営していることを示しています。
  • 一部のナンバープレートが見え、形式は PJ-620-* です。
  • 街灯には黒と白のストライプがあります。
  • 道路の左側の建物には目立つ白い柱があります。

image

NixIntel はその会社の公式ウェブサイトを訪れ、当時その会社がオランダ、ドイツ、デンマーク、ベルギーの 4 カ国で運営されていることを知りました。具体的にどの国かは、ナンバープレートで特定できます。WorldLisencePlatesサイトには、世界各国のナンバープレートのスタイルが収録されています。上記の 4 カ国のスタイルは以下の通りです:

image

4 カ国のナンバープレートの比較。画像出典:WorldLisencePlates

比較すると、オランダのナンバープレートのスタイルが最も近いことがわかり、次にオランダを検索します。もしオランダでなくても、あまり問題ではありません。戻って再選択すればいいのです。

国を特定したら、州や市に絞り込む方法はあるのでしょうか?先ほどの手がかりを振り返ると、トラムは良い手がかりです。なぜなら、すべての都市にトラムがあるわけではないからです。ウィキペディアのオランダのトラムページを調べると、オランダでは現在 5 つの都市でトラムが運営されています:デルフト、ユトレヒト、ロッテルダム、アムステルダム、ハーグです。

image

デルフトのページには明確な建物が見つかりませんでした。ユトレヒトにはいくつかの大きな商業ビルがありますが、やはり一致するものはありません。ロッテルダム、アムステルダム、ハーグははるかに大きな規模であり、答えはその中にある可能性が高いです。大規模な都市には必ず多くの高層ビルがあり、これがロッテルダムのビルです:

image

見てみると、見覚えのある建物があり、高い白い柱が非常に目立ちます。それはユニリーバビルと呼ばれています:

image

ストリートビューに入ると、見慣れた黒と白の電線柱、トラムの軌道、道路が確認でき、撮影地はここであることが確認されました。

image

このケースは、インターネットのオープンソース情報の強力さをよく示しています。専門知識を使わずに、いくつかの情報ポイントを抽出するだけで、インターネットの多様なリソースを利用して探索し、答えを導き出すことができます。これはネット時代が私たち一人一人に与えた超能力です。

自然地理情報#

一般的な自然地理情報には、光影、天候、地形、植物などがあります。自然地理情報を抽出し解読するには、博物館のような広範な自然地理の知識の蓄積と、その上に基づく直感が必要です。多くの著名なネット迷踪のケースでは、重要なステップは大物の一言「この地域のように感じる」というものであり、その奥深さは言葉では表現できません。

一般的に使用される自然地理情報には:

  • 地形:水域(河川、湖、貯水池、海洋)、山脈(積雪)、土壌の色など。
  • 植物:植物は通常、特定の分布地域を持ち、目標範囲が不明な場合は植物情報を使用して排除することができます。しかし、広範な種の導入により、この排除はあまり信頼できません。
  • 光影:影から大まかな方向を得ることができ、進行方向や道路の方向を判断することができます。Suncalcサイトは、影の長さ、位置、または時間を使用して、パラメータ間の相互確認を実現するのに役立ちます。画像中で昼夜が明確に分かることが多く、これにより画像の日夜状態に合わない班次を排除するのに役立ちます。
  • 天候:天候は一般的な補助情報の一つです。所在地の歴史的な天候変化に基づいて、撮影の日付範囲を推測することができます。
  • 人物:地理情報として扱うことができます。画像中の人種に基づいて、画像が撮影された場所を推測することができます。

このセクションでは、炒飯コミュニティのある投稿を例に挙げます。この問題は、炒飯コミュニティの 2 人の大物ユーザー「鞍山のウー・ヤンジュ」と「猫」(以下「猫」)が共同で解決したものです。問題の画像は以下の通りで、撮影者の位置を尋ねています。

image

第三の謎の画像。画像出典:炒飯コミュニティ

鞍山のウー・ヤンジュはこの画像について次のように判断しました:

天候と山の形状、植生から、北京の北(東北三省や内モンゴルの一部を含む)であるべきだと判断しました。

遠くの家屋の赤い瓦の尖った屋根と、前に似たようなトウモロコシの農作物があることから、基本的に東北地域であると確定できます。

image

この判断プロセスは主に経験に基づいていますが、東北地域の範囲は依然として広いです。これが自然地理情報推測の特徴です:豊富な経験知識が必要ですが、範囲を狭めることはできません。

猫はさらに 2 つの判断を加えました:

左側の鉄道には街灯と駅名プレートがあり、撮影位置は鉄道駅の近くであると推測しました。

遠くの民家は南北方向に向いているはずで、北向きの帰線の影が南側にあることはあり得ないため、方位は以下のようになります:

image

左側の鉄道は大体南北に走っており、鉄道を上回る道路は大体東西に偏南に走っており、交差点は駅から 500 メートル以内です。

これで、画像中の情報はすべて抽出されました。人力で東北地域のすべての鉄道交差点を検索することは可能ですが、時間コストが高く、見落としが避けられません。人間の代わりにこれを行うツールはありますか?あります!オープンソース調査の分野で画期的な意味を持つ検索ツールを紹介します:Overpass Turbo。これは、OpenStreetMap に基づく Web ベースのデータマイニングツールです。簡単に言えば、ユーザーが指定した位置関係に基づいて、すべての条件に合致する場所を検索できる地図検索エンジンです。国内では収録されている興味点は少ないですが、鉄道関連情報は比較的完全です。

早く興奮しないでください。以下の情報は、少し難しいかもしれませんが、使用するにはコードを学ぶ必要があります。Overpass Turbo は、Overpass API と呼ばれるクエリ文を使用します。

image

本例で使用するコアコードは以下の通りで、猫が提供しました。私は高速鉄道の条件を引き入れて範囲を狭めようとしましたが、maxspeed フィールドが欠落していることがわかったため、ここでは元のコードを使用します。限られたスペースのため、簡単な注釈説明のみを提供します。興味のある読者は、自分で検索してチュートリアルを学ぶことができます。

// 検索エリア内の長さが 1 キロメートルを超える鉄道橋を検索し、w1 に保存
way[railway = rail][bridge](if: length() > 1000)({{bbox}}) -> .w1;
//w1 と交差(距離 0)、長さが 1 キロメートルを超える非鉄道橋の鉄道を検索し、w2 に保存
way(around.w1: 0)[railway = rail][!bridge](if: length() > 1000) -> .w2;
//w1 の近く 500 メートル、w2 の近く 20 メートルにあるすべての鉄道駅を表示
node(around.w1: 500)(around.w2: 20)[railway = station];

東北地域は広いため、2、3 回に分けて検索できます。結果は以下の通りで、丸印はヒットを示しています:

image

image

Overpass Turbo の検索結果。画像出典:炒飯コミュニティ

前述の鉄道の走行方向に基づいて、条件に合致する駅を 1 つ絞り込むことができます:タファンチ駅です。

image

image

タファンチ駅。画像出典:炒飯コミュニティ、高德地図

このケースは純粋に自然地理情報に依存しているわけではありませんが、これに基づいて所在地域を判断することで、検索作業を大幅に削減しました。Overpass Turbo を利用することで、迅速に広範囲の調査が可能になります。

場外情報#

画像中の情報が不足している場合、探偵たちは場外のヒントを取得する必要があります。以下の各項目は、プライバシーや法律の問題に関わる場合、必ず出題者や当事者の同意、または公式機関の許可を得た上で使用してください。

  • 画像の EXIF 情報:出題者が元の画像を公開し、ネットプラットフォームが EXIF 情報を削除していない場合、この情報を通じて撮影地を直接特定できます。
  • 出題者の履歴:出題者が公共のソーシャルメディアに投稿した内容を確認し、個人のホームページやコメントを含めます。誰かが異なる公共のソーシャルメディアで同じアバターやユーザー名を使用し、類似の内容を投稿している場合、プラットフォームを横断して検索することが容易になります。
  • ソーシャルネットワークの関係:出題者の友人ネットワークも彼自身を暴露する可能性があります。彼と頻繁に交流する友人は、同じ生活経験、同じ興味、または同じ組織に属している可能性が高く、友人が投稿した内容も彼自身に関連している可能性が高いです。

もう二度とネットに何かを投稿しない?#

ネット迷踪はプライバシーに関する疑問をしばしば引き起こします。公衆の疑念を避けるために、炒飯コミュニティや Twitter の @Quiztime は、出題者が本人の撮影した写真を投稿することを主にしています。しかし、悪意のある者が個人をターゲットにして調査を行うことも避けられません。したがって、皆さんがコンテンツを投稿する際には、いくつかの注意を払うべきです。自分のすべての画像が撮影位置を暴露する可能性があると仮定してください。

  • 公開プラットフォームですか?そのプラットフォームで私が投稿した内容を見る前に、友達になったり、私の同意を得る必要がありますか?誰でもアクセスできる情報を投稿する際には非常に注意が必要です。
  • 画像の撮影地が知られると、核心的なプライバシーに関わりますか?自分が訪れた観光地や公共の場を示すことは実際にはあまり影響がありませんが、撮影地があなたや友人の居住地、職場に関連する場合は、画像に前述の情報が含まれていないことを確認し、文案も通勤や交通に関する記述を含まないようにする必要があります。
  • 国家安全に関連する画像の投稿を避けること、例えば武器や軍隊など。

これらの点に注意すれば、王珞丹のように家を盗まれることは基本的にありません。

もし画像が核心的なプライバシーに関わらないが、撮影位置が調査されることを望まない場合は、以下に注意してください:

  • 同じ場所の複数の画像を投稿することを避けること。これはオープンソース調査に十分な情報を提供する可能性があります。
  • 文字情報が多く含まれる画像の投稿を避けること。
  • 特殊な基盤施設情報や自然地理情報が含まれる画像の投稿を避けること。
  • 元画像の投稿を避けること。

この記事を通じて、読者の皆さんがネット迷踪の基本的な遊び方を理解し、画像に含まれる重要な手がかりを分析できるようになったことを願っています。今すぐ、自分の微博や友人のサークルを開いて、どの画像が自分の位置を暴露するかを分析し、自分自身のネットコンテンツの安全専門家になりましょう。

コーチ、私は学びたい#

プライバシーの安全を守る前提で、ネット迷踪は有益な謎解きゲームです。それはプレイヤーの知識を広げ、現実とネットについての理解を深め、推理能力や自発的な情報収集能力を鍛えることができます。

この記事は、画像情報の抽出に重点を置いており、ネットリソースはあくまで補足的に言及されています。私の見解では、どの情報を検索できるかを知ることが、どのように検索するかよりも重要であり、ほとんどの人がネット迷踪に参加する際の最大の障害です —— 画像中に重要な情報が存在することに気づかないことです。この障害を克服した後、画像検索を利用してさらなる情報を取得したり、特定の情報を紹介するウェブサイトをフィルタリングしたりすることができます。もしどのウェブサイトがあるかわからない場合は、検索したり、特定のフォーラムで質問したりすることができ、これは徐々に経験を積むことで解決できる問題です。

どのフォーラムで交流できますか?どの大物のブログを訪問できますか?どのリソースが私を助けてくれますか?これらはあなたに与えられたネット迷踪の問題です:前述の多くのヒントを提供しましたが、今は自発的な情報収集能力を鍛える時です。

あなたのネット探索の旅が順調であることを願っています!

注釈 [1]:この命名は 2018 年の映画「ネット迷踪」と関係があるかもしれませんが、二者の「迷」の書き方には違いがあります。この映画は、エンジニアの父がインターネットを利用して失踪した娘を探す物語です。

注釈 [2]:近い用語にはオンラインオープンソース調査(Online Open Source Investigations, OOSI)があります。これらは通常互換性があるため、この記事ではその違いを探求するつもりはありません。興味のある読者は自分で調べてください。

ネット迷踪への初入門#

2011 年、人人網の「ロシャオユ BHSFer」というユーザーが投稿した「私はどのように王珞丹の住所を推測したか?」という記事が各メディアに転載され、著者は王珞丹の微博に投稿された写真や Google Earth などのツールを利用して、40 分で王珞丹の前の住所を推測する過程を紹介しました。この時、非常に大きな波紋を呼びました[2]

2015 年、微博のユーザーがドラゴンのような形をした川や貯水池の写真を投稿[3]し、多くのユーザーが「偽物」「加工された」とコメントしました(もちろん、より多くのユーザーは運を求めて転送していました)。私の調査によると、これはポルトガルのオデレイテ川(Ribeira de Odeleite)であり、実際に存在することが確認されました。これが私の個人的な初めての「ネット迷踪」旅行

読み込み中...
文章は、創作者によって署名され、ブロックチェーンに安全に保存されています。