ここ最近,自動撮影カメラによる,個体識別の出来ない動物の密度推定モデルを評価した論文がどんどん発表されるようになっている.推定モデルには,REMやRESTだけでなく,TTE,ST,IS,SCなど色々ある.これらを,実際の動物に適用して他の独立な方法と比較したり,シミュレーションを行ったりして,どのモデルによる推定がすぐれているかを調べる,という内容である.
正直なところ,ちゃんとモデルのことを理解して比較しているのは,今のところ以下の論文だけだと思う.この論文は,この分野のパイオニアであるRowcliffeや,MEEの編集委員もやってるAcevedoも著者に入っている通り,さすがに完成度は高い(ここで簡単に紹介).
Palencia, P., Rowcliffe, J.M., Vicente, J., & Acevedo, P. Assessing the camera trap methodologies used to estimate density of unmarked populations. Journal of Applied Ecology, n/a.https://doi.org/10.1111/1365-2664.13913.
残念ながら,ほかの論文は,十分にモデルを理解しないまま「モデルを評価する」という恐ろしいことをしている.しかも,(評価論文だから仕方がないのかもしれないが)結構上から目線で間違ったことを書くものだから,いい気分はしない
そういうのをイチイチ相手にしているとストレスがたまるばかりなので,見て見ぬふりをすることに決めたが(いずれは,評価者を評価する論文を書いてやろうとは思ってるけど),RESTに関しても,確かに間違いやすいポイントがあるのは確かだ.人に聞かれたときにすぐに答えられるようにするためにも,以下で,私も「まっとうだ」と感じる(?)誤りについて正しておきたい.最近出た論文でもまさにこの勘違いをやって,RESTを批判していた.
その批判というのは,「動物の移動速度が変わる場合,自動撮影カメラからは,RESTのパラメータである動物の平均滞在時間は推定できない」というものだ.結論から言うと,これは誤りである.
この点は,結構まじめに考えないと出てこない「誤解」で,かくいう私も,最初に考えたときは,さんざん混乱した.そして,MEEにREST論文がリジェクトされたのは,今から考えると,最後の最後でコメントをしてきた編集者がこの誤解を犯したからだった(査読回数が規定回数に達していたせいもあり,残念ながら反論の機会さえ与えられなかった…).以下,この批判が何を意味していて,どこが誤りなのかを解説してみる.
RESTは,動物の密度(D)が,動物の撮影枚数(Y),調査期間(H),検出エリアの面積(S),Sでの滞在時間(ST),活動時間割合(AR)の関数であることを利用してる.
D = Y/H × ST/S × AR
ここで話をシンプルにするために,H = 1, S = 1, AR = 1だったとする.これらの値は,今の議論には関係ない.そうすると,D = Y × ST,すなわち,以下の関係を考えればいいことになる.
Y = D/ST
今,ある動物が単位面積当たり80頭で生息しているとする(D = 80).この動物は,2つの活動フェーズを持っていて,1日の前半(半分)は滞在時間4秒で素早く行動し,後半(半分)は滞在時間8秒でゆっくり行動したとしよう.そうすると,上の式から,4秒で動く前半は80/4/2 = 10回撮影され,8秒で動く後半は80/8/2 = 5回撮影されることになる(最後2で割っているのは,1日の半分で撮影される枚数だから).
この動物の平均滞在時間はいくらだろうか?多くの人は,4秒 × 1/2 + 8秒 × 1/2 = 6秒として計算してしまうだろう.では,カメラから計算される滞在時間は,どうなるだろうか.カメラでは,4秒が10枚,8秒が5枚なので,平均滞在時間は,4秒 × 10/15 + 8秒 × 5/15 = 80/15 = 5.333と計算される.移動速度が速い(滞在時間が短い)とそれだけ撮影されやすくなるために,平均滞在時間を最初の計算方法よりも短く算出してしまうのだ.
では,これらのうち正しいのはどちらの計算方法だろうか?もう分かった人も多いと思うが,これらの測定値に基づいて密度を計算して正しい結果を返すかを調べてみよう.
まず6秒とした場合,密度D = Y × STだから (10 + 5) × 6 = 90頭になる.これに対し,80/15秒とした場合, (10 + 5) × 80/15 = 80頭になる.もともとの設定は密度80なので後者が正しいことになる.すなわち,(それぞれの滞在時間で過ごしている時間割合について未知でも)カメラで測定された滞在時間をそのまま使って密度推定してよいということになる.
以上のように整理すると分かりやすいと思うが,この問題は,平均速度を求めるのに,算術平均をしてはいけないというごく基礎的な問題と等価である(例えば,ここ).
ここまで一応謙虚な口ぶりで書いてきたが,「偉そうにモデルの評価する前に,小学校の算数の勉強でもしてろ」というのが私の本音である.上のリンクののび太流に言うと「いちばんいけないのは自分が正しいと思い込むことだよ」.ああ,腹立つ.