幻水総選挙2022（バックエンド）

On PostgreSQL Services

On Built-In PostgreSQL

幻水総選挙2022（バックエンド）

いつもの

取得するハッシュタグ

#幻水総選挙2022
#幻水総選挙2022協力攻撃
#幻水総選挙お題小説
#幻水総選挙推し台詞
#幻水総選挙運動

取得方法は次の通り。日時範囲は任意で。

tweets = BySearchWordTweet.where(search_word: "#幻水総選挙運動").where(tweeted_at: Time.zone.parse("2022-05-01").end_of_day..Time.zone.parse("2022-06-26").end_of_day).remove_duplicated.remove_retweet.remove_specific_user_with_id_number(1471724029).remove_specific_user_with_id_number(1388758231825018881).order(tweeted_at: :asc);

キャラクターデータベースの構築と破壊

5分ぐらいかかる
products <-----> characters <-----> nicknames
- いずれも多対多の関係

構築

$ bundle exec rails suikoden_database:import
$ bundle exec rails suikoden_database:destroy

破壊

$ bundle exec rails suikoden_database:destroy

AnalyzeSyntax まわりの流れ

ツイート or DM を指定して、Natural Language に投げる
- 受け取った戻り値を JSON化するなどして analyze_syntaxes に保存する
- これを cron する
- 一つのツイート or DM につき 1つの analyze_syntax が得られる
  - API の戻り値のレコードをまるまる一つに収めたものである
  - 中身は JSON とかあるので掘っていくと個数は多い
    - sentences と tokens が多い
    - なお tokens しか使わない
PickupCharacterNames.execute(tweet_or_dm_object) によって候補名が配列で得られる
- 中身は結構複雑
中身
- AnalyzeSyntax#check_words によって、キャラ名データベースと比較するべき単語を配列で得る
  - この際、除外条件を継ぎ足し継ぎ足ししていっている
    - 作りは最低なのでリファクタすべき

AnalyzeSyntax 具体的な流れ

c = CloudLanguage.client
context = "テッドとルカに。"
response = NaturalLanguage::Analyzer.analyze_tweet_syntax_by_api(c, context)
attrs = {
  language: response.language,
  sentences: response.sentences.map(&:to_json),
  tokens: response.tokens.map(&:to_json),
  tweet_id: nil,
  direct_message_id: nil,
}
as = AnalyzeSyntax.new(attrs)
PickupCharacterNames.exec(as)

Name		Name	Last commit message	Last commit date
Latest commit History 249 Commits
.github/workflows		.github/workflows
app		app
bin		bin
clasp		clasp
config		config
db		db
lib/tasks		lib/tasks
log		log
spec		spec
tmp		tmp
.gitattributes		.gitattributes
.gitignore		.gitignore
.rspec		.rspec
.rubocop.yml		.rubocop.yml
.rubocop_todo.yml		.rubocop_todo.yml
.ruby-version		.ruby-version
Dockerfile		Dockerfile
Gemfile		Gemfile
Gemfile.lock		Gemfile.lock
LICENSE		LICENSE
README.md		README.md
Rakefile		Rakefile
config.ru		config.ru
entrypoint.sh		entrypoint.sh
import_all_counting_data_to_local_db.sh		import_all_counting_data_to_local_db.sh
renovate.json		renovate.json
set_gh_secrets.sh		set_gh_secrets.sh
write_all_final_result_to_sheets.sh		write_all_final_result_to_sheets.sh

License

true-runes/suikoden-election-2022-backend

Folders and files

Latest commit

History

Repository files navigation

幻水総選挙2022（バックエンド）

取得するハッシュタグ

キャラクターデータベースの構築と破壊

構築

破壊

AnalyzeSyntax まわりの流れ

AnalyzeSyntax 具体的な流れ

ドキュメント

Google Natural Language

About

Resources

License

Stars

Watchers

Forks

Languages