2019年公開の面白そうなドラマ、劇場版映画、TV映画を、IMDBとPythonを駆使して徹底的に探しまくりたいと思います。日本では、天気の子や名探偵コナン 紺青の拳が大ヒットしましたが、世界ではどのような映画がヒットしたのかも気になるところです。
import pandas as pd
import requests
df = pd.read_csv('2019movies_10000.csv',encoding='utf-8')
邪魔臭い-を除去する。
df['公開年'] = df['公開年'].str.replace('–','')
(シリーズ物等の)重複タイトルをIMDBスコア最高値だけを残して除去する。
df1=df.sort_values(['タイトル', 'IMDBスコア'],ascending=False).drop_duplicates(['タイトル'], keep='first')
列の順序を見易いように変更する。
df1=df1[['タイトル','ジャンル','IMDBスコア','メタスコア','投票数','興行収入','あらすじ','監督','出演者','上映時間','公開年']]
アニメジャンルは前回検索済みなので今回は除去する。
df2 = df1.dropna(subset=['ジャンル'])
df3 = df2[(-df2['ジャンル'].str.contains("Animation"))]
df3.sort_values(by='IMDBスコア',ascending=False).head(20)
「All Japan for Peace and Coexistence: Gerbera Revolution (オールジャパン平和と共生:ガーベラ革命)」っていうのが何なのか調べたら反安倍政権市民運動のような内容だった。
メタスコア最高値作品¶
メタスコア上位20作品を抽出する。
df3[(df3['メタスコア'] > 0)].sort_values(by='メタスコア',ascending=False).head(20)
IMDBスコアと投票数で作品を絞り込む¶
IMDBスコアが8以上かつ投票数1万以上の作品を投票数が多い順に抽出する。
df3[(df3['IMDBスコア'] > 7.9) & (df3['投票数'] > 1e4) & (-df3['タイトル'].str.contains('Chernobyl'))].sort_values(by='投票数',ascending=False)
IMDBスコアが7〜8かつ投票数1万以上の作品を投票数が多い順に抽出する。
df3[(df3['IMDBスコア'] > 6.9) & (df3['IMDBスコア'] < 8.0) & (df3['投票数'] >= 1e4)].sort_values(by='投票数',ascending=False)
Usが面白そうである。日本では9月6日公開となっている。アスのメタスコアはアラジンを遥かに上回っているが、世界興収は遥かに下回っている。日本でもアラジンに遠く及ばないことが予想される。ホラー映画好きの日本ではあるものの、洋物ホラー・サスペンス映画は全く受けないのが現実である。今度はホラー映画に絞って検索してみる。
df3[(df3['ジャンル'].str.contains("Horror"))&(df3['興行収入'].str.contains("$"))].sort_values(by='IMDBスコア',ascending=False)
「Annabelle Comes Home (アナベル死霊博物館)」の日本公開は9月20日。「エスケープルーム」は日本公開未定のようだ。チャッキーで有名な「チャイルド・プレイ」は7月19日公開予定。この日は新海誠監督の新作「天気の子」も公開される予定である。「Happy Death Day 2U (ハッピー・デス・デイ 2U)」は7月12日公開予定。「ペット・セメタリー」まだやってんのかという感じだが、この作品の日本公開日は未定。「プロディジー」も日本公開日未定。「Ma」の日本公開日も未定。「The Intruder (ジ・イントルーダー)」も公開日未定。「The Curse of La Llorona (ラ・ヨローナ〜泣く女〜)」は5月10日に日本公開されている。ついでにゴジラの評価を見てみる。
df3[(df3['タイトル'].str.contains("Godzilla"))]
IMDBスコアもメタスコアも低過ぎる。北米興行収入も国内興行収入同様、相当悲惨な事になっている。「ゴジラ キング・オブ・モンスターズ」は史上最悪の洋物ゴジラ映画と言っても決して過言ではないだろう。次に、IMDBスコア最低映画を抽出する。
df3[df3['興行収入'].str.contains('\d',regex=True,na=False)].sort_values(by='IMDBスコア',ascending=True).head(10)
IMDBスコアが最低の作品を抽出してみる。
df3[-df3['あらすじ'].str.contains('Add a Plot\n')].sort_values(by='IMDBスコア',ascending=True).head(10)
「まく子」とかいう日本映画があるようだ。IMDBスコアと投票数から察するに酷い映画であることは容易に想像がつく。