先日Vook主催にて映像向けベンチマークのイベントが開催された。そこに現役のフィルムエディターとしてPC評価の役回りで参加させて頂いたので、まとめたいと思う。

この記事はPC関連に明るい人間をターゲットとする為、PCはあまり、という方は以下を参照して欲しい。

また、当該イベントをASCII.jpが取り上げてくれたので、以下も併せて確認して欲しい。
http://ascii.jp/elem/000/001/694/1694955/

TVCM業界とハードウェア

筆者は元々3ds maxを用いたエフェクト系のCG制作からキャリアをスタートし、現在ではTVCMにおけるオフラインエディットとポストプロダクション工程全体のコーディネートを行なっている。

TVCM業界では分業制が発達しており、以前は用途別に専用機を用いたスタジオが基本となっていた。しかし昨今AdobeやAvid、Autodesk、Blackmagicを筆頭に、ソフトウェアとして提供されるソリューションを用いることが当たり前になってきている。移行当初は専用機からソフトウェア化するに当たってMacが採用される事例が多かったのだが、PCの進化にあわせて徐々にWindowsベースでも業務に耐え得る状況が整いつつある。特にハイエンドにおいてはハードウェアスペック的にPCの方が現実解となりつつある状況だ。

しかしことノートPCにおいては、ProResとHFS+の普及が足枷になり、現在でもMac Book Proが支配的だ。今まで通り、オフライン編集などの軽い業務ばかりであればそれでも良かったのかもしれないが、ソフトウェアの進化に伴ってAftereffectsやDavinci Resolveを出先で必要とされる機会も増えつつある中、ノートPCの絶対性能が不足する場面が増えてきている。

Vookをご覧の皆さんの中にもMacからの移行に限らず、ノートPCの検討している方もいらっしゃるだろう。今回はマウスコンピューターの協力の元、予算別にWindowsノートを検証する機会を得た。そこで映像制作の視点に立ったベンチマークを行いたいと思う。

マシンスペック

以下に今回検証したPCを一覧する。なお、GS65 8RFとMac Book Pro Late2016に関しては全てのデータは取得できなかったことに注意されたい。

Maker: MouseComputer
Model: LuvBook J シリーズ LB-J322E (販売終了)
CPU: Inel Celeron 3215U 2Core 1.7Ghz
RAM: PC3-12800 4GB
SSD: 32GB SerialATAIII
GPU: Intel HD Graphics
OS: Windows 10 Home

Maker: MouseComputer
Model: m-Book F556BD-S2
CPU: Intel Core i5-8250U 4C/8T 1.6Ghz/TB3.4Ghz
RAM: PC4-19200 8GB
SSD: 240GB SerialATAIII
GPU: Intel HD Graphics
OS: Windows 10 Home

Maker: MouseComputer
Model: DAIV-NG4500M1-SH5-CS
CPU: Intel Core i7-7700HQ 4C/8T 2.8Ghz/TB3.8Ghz
RAM: PC4-19200 16GB
SSD: 512GB M.2/SerialATAIII
GPU: Geforce GTX 1050 / Intel HD Graphics
OS: Windows 10 Home

Maker: MouseComputer
Model: MousePro-NB991Z-SSD
CPU: Intel Core i7-7700HQ 4C/8T 2.8Ghz/TB3.8Ghz
RAM: PC4-19200 16GB
SSD: 512GB M.2/SerialATAIII
GPU: Quadro P3000 / Intel HD Graphics
OS: Windows 10 Pro

Maker: MouseComputer
Model: DAIV-NG7620M2-M2S10
CPU: Intel Core i7-8700K 6C/12T 3.7Ghz/TB4.7Ghz
RAM: PC4-19200 32GB
SSD1: 512GB WD Black M.2 NVMe / System
SSD2: 512GB WD Black M.2 NVMe / Footages
GPU: Geforce GTX 1080
OS: Windows 10 Pro

Maker: MSI
Model: GS65 8RF
CPU: Intel Core i7-8750H 6C/12T 2.2Ghz/TB4.1Ghz
RAM: PC4-19200 16GB
SSD: 512GB M.2 NVMe
GPU: Geforce GTX 1070 with Max-Q Design
OS: Windows 10 Home
備考: 参考出展の為全データは取得できず

Maker: Apple
Model: Mac Book Pro Late2016
CPU: Intel Core i7-7820HQ 4C/8T 2.9Ghz/TB3.9Ghz
RAM: PC3-12800 16GB
SSD: 512GB NVMe
GPU: Radeon Pro 460 4GB
OS: Mac OS X 10.13.4 High Sierra
備考: 参考出展の為全データは取得できず

Maker: None
Model: Kurzweil
CPU: AMD Ryzen Threadripper 1950x 16C/32T 3.4Ghz/Boost 4Ghz
RAM: PC4-25600 128GB
SSD1: 512GB Sumsung 960 Pro M.2 NVMe / System
SSD2: 512GB Sumsung 960 Pro M.2 NVMe x4 RAID / Footages
SSD3: 512GB Sumsung 960 Pro M.2 NVMe x2 RAID / Cache
GPU: Geforce GTX 1080 Ti x2
OS: Windows 10 Pro
備考: 参考出展

CINEBENCH R15 CPU

ご存知、CINEBENCH R15から始めたいと思う。CINEBENCHの元になったCINEMA4Dが既にR19を現行バージョンとすることから分かるように、CINEBENCH自体はそこそこ古いベンチマークの部類になる。しかし古典的なCGレンダリングという意味でその指標は現在でも通用するのと、何よりこれまで各メディアが採用してきた実績から比較対象が豊富であることから、レガシーなベンチマークの代表として採用することとした。

CINEBENCH R15については以下参照。

実行手順

  1. CINEBENCH R15を起動する
  2. FileメニューよりAdvansd Benchmarkのチェックを入れる
  3. OpenGLを実行する
  4. CPUを実行する
  5. CPU (Single Core)を実行する (イベントでは未実施)
  6. 3~5の手順を3回繰り返し、平均値をとる

CINEBENCHはCPUとOpenGLの二つのテストから成り立っている。CPUについては、先に書いた通り古典的なマルチスレッドテストになっている。我々が実際の業務で使うレンダラーの進化とは別の話として、単純にCPUの全コア全スレッドに最大負荷を掛けることができるCINEBENCHのCPUテストは、今でも現役の指標として成り立っている。

グラフを見てみよう。結果はほぼシングルスレッド性能xコア/スレッド数でリニアに伸びているように見える。ここで最も高いスコアを記録したのは、申し訳ないことに参考出展の筆者マシンであるKurzweilだ。Kurzweilはデスクトップ型のワークステーションとして設計されており、CPUにAMDのRyzen Threadripper 1950xを搭載しているので、除外して比較しよう。DAIV-NG4500M1-SH5-CSとMousePro-NB991Z-SSDがi7 7700HQ(4C12T標準2.8GhzTB3.8Ghz)と同じCPUを採用していることからスコアが誤差範囲であることに対して、MSI GS65 8RFはi7 8750H(6C12T標準2.2Ghz/TB4.1Ghz)と、コア数はより多く、TB無しの標準クロックは低いという状況の中で、より高いスコアを記録している。ここから分かることとしては、コア数の増加が強力に効いており、またクロックが下がった分をコア数増加とIPC増加で賄えているということである。残念ながら時間の都合上シングルスレッドの比較は行えていないのでIPCの上昇率はこのグラフからは読み取れないのだが、第8世代i7の面目は保たれていると評価できる。

なお、DAIV-NG7620M2-M2S10に関してはそもそもデスクトップ用のi7 8700k(6C12T標準3.7GhzTB4.7Ghz)を搭載しており、頭一つ抜けることはむべなるかなといった塩梅だ。

次のOpenGLテストについては、CINEMA4D R15時点でのビューポート画面(CGソフトにおける作業用プレビュー画面)をシミュレートしたものだ。一般的にはゲーム用のGPUはDirect3D、プロ用のGPUはOpenGLに最適化されていると言われてきたが、昨今ではCGソフトもビューポートにDirect3Dを採用することが多く、またベンチマーク内容が古くスコアが頭打ちになりつつある為、あまり実用的ではなくなってきている。

とは言えレガシーなベンチマークの代表として結果のグラフを見ていこう。流石にGPUの有無は大きな影響があることが分かるが、あまりCUDAコア数がスコアに影響していないことが読み取れる。特徴的なのはGeforce GTX 1050を積んだDAIV-NG4500M1-SH5-CSとQuadro P3000を積んだMousePro-NB991Z-SSDの結果が、誤差範囲とはいえ価格に反して逆転していることだ。Quadro P3000はNVIDAのサイトで探しても中々情報を見つけることのできないOEM向けのGPUだが、以下のサイトからLenovoやFujitsuのマシンのGPU Optionを見ることでCUDAコア数を確認できる。

https://www.nvidia.com/en-us/design-visualization/quadro-for-mobile-workstations/

NVIDIAの公式サイトであるのでおそらく間違いない情報として、CUDAコア数は1280個。クロックはともかく、Geforce GTX 1060 6GB相当と考えることができそうだ。対してGeforce GTX 1050のCUDAコア数は640個。DAIV-NG4500M1-SH5-CSとMousePro-NB991Z-SSDはGPU以外に目に見えるスペックの差異は少ない為、ただただスペック的な意味ではQuadro P3000が上で然るべきである。Direct3Dではなく本来Quadroが有利なはずのOpen GLテストであることも含めると、OS再インストールなど含めた再試験がしたい状態ではある。

V-RAY Benchmark 1.0.8

V-RAYは国内においてデファクトスタンダードといっても過言ではないほど、CG業務に用いられることの多いレンダラーだ。V-RAY Benchmarkは、そのV-RAYを開発したChaosGroupが提供するガチのレンダリングをシミュレートしたベンチマークテストである。CINEBENCHに比べ、より新しい世代のCGレンダラーのテストになることに加え、デフォルトでランキング機能を持っており、世界中のCG用レンダリングPCと性能比較ができることも魅力だ。

V-RAY Benchmark 1.0.8については以下参照。

実行手順

  1. V-RAY Benchmarkを起動する
  2. CPUを実行する
  3. GPUを実行する
  4. 2~3の手順を3回繰り返し、平均値をとる

このベンチマークはレンダリングに掛かった時間を比較している為、短い方がより高性能ということになる。
まずCPUテストについて。相変わらずKurzweilの結果は参考出展レベルとして、他は順当といった風情。同じく参考出展のMac Book Pro Latn2016も、i7 7820HQ相当と考えると、i7 7700HQ勢と誤差範囲。CINEBENCHよりも微妙に結果が振るわないのは、OSレベルの最適化のせいかもしれない。

GPUテストは、CINEBENCHとはかなり傾向が違う。V-RAY BenchmarkのGPUテストは、いわゆるリアルタイム系のレンダラーではなく、映画や建築パースの最終結果に使用可能なものとして設計されている。つまり、出てくる画のレベルとしてはCPUテストと遜色ないものなのだ。ここでの結果は、かなりGPUのスペックと比例したものになっている。先のCINEBENCH OpenGLのように、Geforce GTX 1050とQuadro P3000が逆転するようなこともなく、完全リニアではないにせよ、CUDAコア数通りの結果になっている。

なお、このテストはNVIDIAにあらずんば人にあらずを地で行っており、Radeon搭載のMac Book Pro及びIntel HDグラフィックスのみのマシンは全て計測不能であった。

CrystalDiskMark 6.0.0

WindowsベースのPC系ベンチマークでは欠かすことのできないストレージベンチマークである。バージョンを重ねるごとに、SSDなどについてもより実体験に近い数値が出るようになってきており、デファクトスタンダードの一つと言える。世の中では各種メディア筆頭に様々な結果が共有されており、比較対象には事欠かない。

CrystalDiskMark 6.0.0については以下参照。

実行手順

  1. Crystal Disk Markを起動する
  2. テストサイズを4GiBに設定する
  3. テスト対象のディスクを選択する
  4. ALLを実行する
  5. 3回繰り返し、平均値をとる


最初に、映像制作におけるストレージ負荷の傾向を確認しておこう。例えば弊社でよく扱うカメラ、RED Dragon 6kのREDCODE1:8では30p時に888Mbps(111MB/sec)であり、1min収録時のファイル容量は6.66GBとなる。映像制作では他の用途に比べ、扱う容量が極端に大きいのだ。GBオーダーのファイルを日常的に扱う必要があり、勢いシーケンシャル性能をまず見ることになる。

各マシン、SSDを載せてきたものについては順当な速度を達成している。特にDAIV-NG7620M2-M2S10については、NVMeらしいスコアを達成しており、RED Dragon 6k程度の素材であればストレージ的には切り盛りできそうだ。Kurzweilについては、実務上もっと重いデータを扱うこともある、とだけ言っておく。

After Effects CC 2018 (15.1.1) Benchmark

さて、今回の本命の1つである。映像制作において、After Effectsはもはや無視できない存在となっている。After Effectsはいわゆる映像編集とは違い、合成やモーショングラフィックスを司る存在だ。それだけに演算能力に対して貪欲なソフトウェアである。

After Effects CC 2018 Benchmarkのプロジェクトは以下より。

実行手順

  1. After Effects CC 2018を起動する (要RED GIANT Trapcode Suite)
  2. STUD_AE_Bench.aepを開く
  3. 編集メニューより、キャッシュの消去>すべてのメモリ&ディスクキャッシュを選択
  4. レンダーキューを開く
  5. Light~Ultraの中で、テストしたいコンポジションのレンダリング先を選択する
  6. レンダリングする
  7. STUD_AE_Bench.aepと同一階層にログが吐き出されるので、経過時間行の数値を控える
  8. 2~7を3回繰り返し、平均値をとる
  9. 別のコンポジションをテストしたい場合も同様に、2~7を一連の作業とする


ベンチマークにはLight〜Ultraの各バージョンがあり、Lightはストレージ依存度高め、MidiumはCPU、HeavyとUltraはGPUも含めた総合力勝負の想定で作っている。

Lightはストレージで頭打ちの為、一定以上のストレージとCPUを持ったPCは横並びに見える。しかしHeavy以上において、参考出展の為比較に入れないように、と言い続けてきたKurzweilの牙城が崩れたことに衝撃を受けざる負えない。

確かにこれまでもAfter Effectsについてはコア数よりもクロックが重要とされて来た歴史はあるが、最新バージョンにおいてもその傾向は変わらないということか。16C32Tのマシンが6C12Tのマシンに負けているのである。しかもデスクトップワークステーションとノートPCの比較で、である。恐るべきはIntelであり、マウスコンピューターといったところか。

真面目に考察すると、ソフトウェアのマルチスレッド最適化の不足に加え、Ryzen Threadripper 1950xとi7 8700kのIPC差が如実に出た格好だ。IntelとAMDの各CPUに対するAdobeの最適化度合いの差もあるように思う。

また、GPUの差も結果に影響してはいるものの、積極的にGPUを使用しているわけではないことも改めて分かった。ベンチマークとしてはよりGPUを使う為に、対応を謳うREDGIANT Trapcode系のプラグインも含んでいるのだが、実行中にタスクマネージャを確認した際のGPU使用率は2〜5%程度であった為、積極的に使っているとは言えない状況だ。

MousePro-NB991Z-SSDについてはUltraでm-Book F556BD-S2と同程度という不可解なスコアである。GPU負荷率は他のPCと比べても大差なかったので、Quadroだから悪いとは言えないように思う。検証機は普段から使用されているデモ用であった為、やはりOS再インストールを試みたいところだ。

Premiere Pro 2018 (12.1.1) Benchmark

Prmiere Proのエンコードテストはたまに各種メディアのベンチマーク記事に掲載されているが、大抵の場合は素材ファイルが手に入らず追試できない為、今回は素材ファイルをダウンロード可能にしてみた。

Premiere Pro 2018 (12.1.1) Benchmarkの素材ファイルについては以下。

実行手順

  1. Premiere Pro CC 2018を起動する
  2. STUD_PR_Bench.prprojを開く
  3. HDシーケンスを選択し、メディアの書き出しウィンドウを開く
  4. フォーマット H.264、プリセット High Quarity 1080p HD を選択し、Media Encoderにキューイングする
  5. Media Encoderよりエンコードを行う
  6. ステータス列の完了をクリックすることでログが見れるので、エンコード時間行の数値を控える
  7. 3~6の手順を3回繰り返し、平均値をとる
  8. UHD to UHDについてはUHDシーケンスを選択し、プリセット"High Quarity 2160p 4k"を選択する
  9. UHD to HDについて、UHDシーケンスを選択し、プリセット"High Quarity 1080p HD"を選択する

HD to HDは昨今では軽めの作業の為、LuvBook J シリーズ LB-J322E以外はほぼ誤差範囲の中で実時間を切っている。

UHD to UHDについては、最速の結果を叩き出したのがDAIV-NG4500M1-SH5-CSであり、結果に疑問符が付く。また、Mac Book Pro Late2016も何気に検討している。もう少し時間を掛けて追試したい結果となった。

UHD to HDについては、スケーリング(縮小処理)を意図的に発生させている。スケーリングにおいてPremiere ProはGPUを使用するとの情報があった為試してみたわけだが、UHD to UHDに対して比較的ハードウェアスペック通りの差となった。

全体を通して最速はGeforce GTX 1050を搭載したDAIV-NG4500M1-SH5-CSだった。Premiere Proでのエンコードに特殊なチューニングが必要なのか、そもそも粒度がsecレベルでもあり、誤差が大きくてベンチマークに向かないのか判断し辛い結果となった。Premiere Proを用いたベンチマークには、エンコードとは違った指標が必要かもしれない。次の機会があれば検討したい。

Davinci Resolve 15β3 / Standard Candle

今回の本命その2。Davinci Resolveは昨今オフライン、オンライン(コンポジット)、グレーディング、MAと制作業務の全行程をその手中におさめた、野心的なソフトウェアだ。元々カラーグレーディング用として始まった時から、コマ落ち無しのリアルタイム動作を信条としており、現在ではそこそこのマシンでも4kはリアルタイム動作可能、 8k以上でもハードウェア次第ではリアルタイム動作に対応する。そんな並外れた性能をを実現する為にDavinci Resolveが選択したのが、とにかく圧倒的なGPUへの傾倒である。

また野心的、という意味ではDavinci Resolveにはフリー版も存在しており、Windows/Mac/Linuxそれぞれ無料で追試が可能だ。フリー版の制限はGPU認識数といくつかのエフェクト程度であり、クライアント立会い試写をするようなプロでなければほとんどの場合フリー版で足りる。

Standard CandleはそんなResolveでのPC性能を測るために、Sascha Habe氏が作成したそこそこ古いベンチマークである。そこそこ古いとは言ったものの、当初で言ったら非現実的なレベルのGPUまでその対象としていたこともあって、現在のGPUでもスコアはカンストしない現役のベンチマークと言って良いだろう。

Standard Candleのダンウロード方法については以下を参照。

実行手順

  1. Davinci Resolve 15を起動する
  2. scr10_20140123.drpをインポートし、開く
  3. 必要があれば素材の再リンクを実施する
  4. Colorページに移動し、グレーディングバージョンより計測したいテストのバージョンを選択してロードする
  5. 3分間プレイバックし、プログラムモニター左上のfps表示を監視する
  6. 最初の1分間を除いた、後半2分間の中でfpsの最低値を控える


Davinci Resolveにおいてはリアルタイム処理ができたか否かが最重要である為、ここではタイムラインの設定値である24fpsを達成できているかどうかを評価する。Standard CandleにはBlurとTNRの二種類のテストがあるが、それぞれBlur(ぼかし)、Temporal Noise Reduction(時間方向のノイズ低減処理)をいくつも重ねてfpsを測る形のテストとなっている。なお、フリー版ではTNR機能は制限されているが、ウォーターマークが出るだけで処理自体は行われており、ベンチマークには問題ない。

このテストはグラフの下方に行くほど処理が重くなっていくので、どこまで耐えられるかを見ていくテストだ。結果、非常に綺麗にGPU差が出た。例えばGeforce GTX 1080搭載のDAIV-NG7620M2-M2S10であれば、18回Blurを掛けても24fpsを維持できることが分かる。After Effectsのブラーで同じことをしてみればその凄さが分かるかもしれない。TNRについても2回まで重ねてリアルタイム再生できており、After Effectsのグレイン(除去)で同じことを以下略。

世の中にはStandard Candleにおいて、Davinci ResolveのLinux版を使用してGPU16枚などの化け物環境でテストした結果もあるので、GPUに自信のある人は是非検索して見てほしい。

Davinci Resolve 15β3 / CinamaDNG

Standard Candleは十分に現役のベンチマークだが、ここではより実務に近い形のテストとして、弊社所有のURSA Mini Pro 4.6kを使用し、CinamaDNG RAWファイルを元素材にカラーグレーディングをしてみた。

素材とプロジェクトファイルは以下。
URLは後日公開

実行手順

  1. Davinci Resolve 15を起動する
  2. Resolve_Bench_HD.drp、又はResolve_Bench_UHD.drpをインポートし、開く
  3. 必要があれば素材の再リンクを実施する
  4. Colorページに移動し、グレーディングバージョンより計測したいテストのバージョンを選択してロードする
  5. 3分間プレイバックし、プログラムモニター左上のfps表示を監視する
  6. 最初の1分間を除いた、後半2分間の中でfpsの最低値を控える


昨今の映像用のRAWファイルは、ディベイヤー(デコード)時にその解像度を指定できるものが少なくない。RAW自体はセンサーフルだが、RGB化するに当たって処理を間引いて高速化することができるという訳だ。URSA Mini Pro 4.6kのCinamaDNG RAWも御多分に漏れずディベイヤー解像度を選択できる。そこで今回は4.6kのRAWから1/2解像度でフルHDタイムラインに編集したものと、1/1解像度でUHDタイムラインに編集したものを用意した。

4.6k to HDの結果を見てみよう。Premiere Proで見たUHD to HDとは違って、スケーリングではなくディベイヤー時に処理を間引いている為、全PCで処理が軽くなっている。Geforce GTX 1080搭載のDAIV-NG7620M2-M2S10においては、TNRありでも実作業上リアルタイム処理を維持できると言える。

4.6k to UHDに際しては流石に全体的に重くはなって来るがGeforce GTX 1080 Ti x2のKurzweilなら実作業上問題ないことが分かる。

総じて、Geforce GTX 1060以上があればHDは余裕、UHDはノートではもう少し世代更新が必要、と言ったところか。

Davinci Resolve 15β3 / RED

イベント直前に、仕事上よく使われるファイルとしてRED素材に対するベンチマークの要望があった。RED系のカメラが採用する、REDCODEのディベイヤーでもGPUが使用される為、参考資料としてRED Scarlet 4k撮影のDCI 4k 29.976fps素材をHDタイムラインで試してみた。

REDで試した素材とプロジェクトは以下。
URLは後日公開

実行手順

  1. Davinci Resolve 15を起動する
  2. Resolve_Bench_HD.drp、又はResolve_Bench_UHD.drpをインポートし、開く
  3. 必要があれば素材の再リンクを実施する
  4. Colorページに移動し、グレーディングバージョンより計測したいテストのバージョンを選択してロードする
  5. 3分間プレイバックし、プログラムモニター左上のfps表示を監視する
  6. 最初の1分間を除いた、後半2分間の中でfpsの最低値を控える

IMG_1998.PNG

昔はREDCODEのディベイヤーにはRED Rocketという高価な専用ハードウェアが必要であったが、グラフを見る限りGeforce GTX 1080以上のGPUがあれば4kソースは楽勝である。なんとよい時代になったものか。

総評

総じて、DAIV-NG7620M2-M2S10の強さが目立った。ただしこのPCの中身はほとんどデスクトップPCと遜色ないものである為、純粋にノートPCとしては評価し辛い。しかし一部テストでRyzen Threadripper 1950xを破っていることもあり、i7 8700kはかなり素性が良いように思われる。

ベンチマークとしては、Premiere Proの結果が安定しなかった。今後他ベンチマークも含めレギュレーションの最適化、テスト内容の見直しをしたい。可能であれば、定期的レギュレーションをアップデートしつつ、比較対象として価値のあるものに育てていければと思っている。

今回はタイミングの都合もあり、COMPUTEX TAIPEI 2018で発表されたような最新世代のノートPCを用意できなかったことが残念だった。第8世代i7のノートが出揃ったタイミングで再評価を行うことで、ノートPCの新次元が見えてきそうな予感もある。引き続きハードウェアの進化に期待したい。

1クリップする
クリップしておくと
あとからいつでも
見返したりできます。

    コメント

    • まだコメントはありません