INTP型のブログ

苦味があるな?

大型データベースサイトの知見まとめ

まだまだデータ足りないけど、現時点でのやつ

 

googleのインデックス対応

自分の感覚だけど、作ってから1~2ヶ月ぐらいでクローラーの気まぐれでインデックスされ始めるイメージ

 

ただそれだと検証速度的に微妙なのでindexing apiを使った方がいい

 

developers.google.com

 

現在、Indexing API は、JobPosting が追加されたページ、または VideoObject に BroadcastEvent が埋め込まれたページをクロールするためにのみ使用できます。

 

googleが想定する使われ方は上記のような求人やライブストリームなどのページだけど、別にその他ページでも使えないわけではない

 

規約違反に該当する可能性があると言われているけど、自分が知る限り + 調べた限りでindexing apiによってそうなったという話を聞いたことはない

 

indexing apiを使った場合、送信後数十分でクローラーが巡回し、コンテンツ量が十分であれば24時間後以内にはindexされる印象

 

200/日の制限があるので、毎日送信するようなスクリプトを書いておくと良い(なんか増えることもあるらしいけど、よくわかんない。利用状況とか?)

 

googleサイトマップ送信について

長期的には意味あると思ってるけど、短期的にはそこまで影響ないような気がした

 

SEOつよつよの人の話で、サイトマップの更新頻度をgoogleは見てるんじゃね?みたいな話もある(2年ぐらい前だけど)。ただ短期的にはサイトマップの更新頻度がseoに影響するって印象はないし、インデックスにも効果出てないようなきがする

 

サイトマップ送ってから3ヶ月ぐらいするとちょっとずつ意味出てくるイメージ。この辺は流入数とかSNSでの拡散状況とか、その他諸々の外部要因で変わるとは思う

 

DB系サイトは王道な手法ではないので、単にサイトマップ送って放置はあまり強い戦略には思えない

 

ので、やはりインデックス戦略としてindexing apiを使うのが強いとは思う

 

bingのインデックス対応

正直あんまりわかんないけど、サイトマップ送って、毎日100/日のurl送信をやっておけばいいと思った。submission apiとか使って自動化するのが良い

 

あとはわからん、謎

 

ページ数について

 

どれぐらいの規模感にしたほうが良いのかは謎だけど、indexing apiの制限が1サイトに対して200/日になるので1ヶ月ぐらいで全URLが送信できるように全体で6000ページ以内に収まるのが良いんじゃないかとか思った

 

単純なユーザー体験という目線を持ったとしても、例えば全国のラーメン屋のデータベースを持つよりは、宮城は仙台のラーメン屋データベースとして機能したほうが競合が少なく、ユーザー体験も良くしやすい

 

indexing apigcpからプロジェクトを作成して使うことになるんだけど、200/日制限はプロジェクト単位にかかってくるので、確かプロジェクトの最大数が10件だかだったことを考えると6000ページであっても60000ページ分は用意できる

 

更に伸びたサイトは継続して、伸びなかったサイトは削ってとやっていけば十分なように感じる

 

コンテンツに関して

 

自動生成文章を500文字前後想定で作成して突っ込んでおいた

 

indexは問題なくされているようなので、indexタイミングで自動生成文章を見抜くアルゴリズムはやはりない。

 

恐れるべきはgoogleの手動によるペナルティだろうけど、これはアクセスが溜まってきたら文章を手作業で整形していけばまあなんとかならなくもないと思ってる

 

また、ペナったとしてもドメイン捨てて載せ替えてもいいし、制作コストもそんなに高くないのでそのまま放棄しても良いと思う

 

サーチコンソール登録→ペナ→他サイトに影響。が個人的に一番嫌だけど、そのへんはそうなったら考えればいいかなぁと思う。うまく言ってるならahrefs契約して、そこのダッシュボードでクエリ状況確認しても良いし

 

なお、自動生成文章を入れる前にindexing apiを試したことはないのでインデックスにそれが有効に働いたかは謎。ただ経験的にはコンテンツ量が少ないとクローラー回してもインデックス拒否されるので、有効なのではとは思ってる(でもindexing apiの用途を考えると、割と雑にindexさせてくれるのかもしれない。わかんね)

 

検索パフォーマンス

 

まだわかんない

 

基本的には

  1. title
  2. description
  3. h1, h2, h3
  4. canonical

付けとけば十分かなと思う。

 

細かいパフォーマンスを詰めるのは割とコストがかかるというか実装が大変なので、伸びたらUX改善と合わせてやっていけば良いんじゃないかなぁという気持ち

 

なおcanonicalに関しては、付けないと?page=2とかがindexされたりしてうざいことになるのでやっておいたほうが良い

 

---

 

index周りがなんとなかったので、あとは検索パフォーマンス次第。

 

ここがよかったら量産体制に入りたい

 

ただ7月からちょっと忙しくなりそうなのがネック

 

ここからはめちゃプライベート話なんだけど弊社、完全歩合制にするらしい。

 

ついに未経験エンジニアの俺が重くなったのか?とか思ったけど、なんか給料1.5倍になるらしいのでやったぜという感じ(自慢)

 

どちらかというと経験3年でとった人が思ったより使えなかったので、その保険として完全歩合制にするという話らしい

 

急激な給与形態の変更にそういや俺の勤めてる会社ってスタートアップなのだった。と思った次第でした、おわり。