Translate

2017년 9월 24일 일요일

사후 검정 - Tukey's HSD test

앞서 포스트에서 3개 이상의 그룹에서 평균의 차이를 알아보는 분산분석 (ANOVA)에 대해서 알아봤습니다. 하지만 기본적으로 이것은 세 그룹 간의 평균의 차이가 있다는 것만 알려주지 어느 것이 차이가 있는지를 알려주지는 않습니다. 세 그룹에서 구체적으로 어느 것이 차이가 있는지를 말해주지는 않습니다. 


 분산분석에서 구체적으로 어느 그룹이 차이가 있는지 검정하는 것이 사후 검정(host hoc analysis)이며 종종 논문에서 요구하는 경우가 있으므로 분산분석 기법을 사용해야 하는 연구자라면 어느 정도 내용을 알고 있을 필요가 있습니다. 우선 Tukey's HSD (honest significant difference) test 부터 알아보겠습니다. 


 Tukey' HSD는 단순히 Tukey's test라고 부르거나 Tukey–Kramer method라고 하는데, t 분포와 유사한 studentized range distribution (q)에 기반을 두고 각 그룹의 평균의 차이가 있는지 사후 검정을 시도합니다. 이를 위해서는 3가지 가정이 필요합니다. 


The observations being tested are independent within and among the groups.
(각 그룹의 관측치가 서로 독립적) 

The groups associated with each mean in the test are normally distributed.
(각 그룹의 분포가 정규분포를 따를 것) 

There is equal within-group variance across the groups associated with each mean in the test (homogeneity of variance).
(그룹간의 분산이 동일할 것. 즉 등분산 가정) 


 연구 내용에 따라서 이런 경우는 많지 않을 수도 있습니다. 거의 동일한 특징을 가진 대조군이나 실험군 끼리의 비교나 혹은 연구 대상을 3그룹 이상 같은 수로 균일하게 나누는 경우 등이 해당될 것입니다. 숫자와 특징이 크게 차이나는 그룹간의 비교에서는 가정이 성립하지 않을 수 있습니다. 아무튼 앞서 예제를 이용해서 시행해 보겠습니다. 적용은 간단해서 TukeyHSD () 만 적용해주면 됩니다. 

> set.seed(1234)
> A<-rnorm span="">
> set.seed(123)
> B<-rnorm span="">
> set.seed(12345)
> C<-rnorm span="">
> DFA<-data .frame="" class="" height="" span="">
> colnames(DFA)<-c height="" lass="" span="">
> DFB<-data .frame="" class="" height="" span="">
> colnames(DFB)<-c height="" lass="" span="">
> DFC<-data .frame="" class="" height="" span="">
> colnames(DFC)<-c height="" lass="" span="">
> DF2<-rbind span="">
> out=aov(height~Class, data=DF2)
> summary(out)
            Df Sum Sq Mean Sq F value Pr(>F)  
Class        2  152.5   76.24   3.442 0.0364 *
Residuals   87 1927.1   22.15                 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> TukeyHSD(out)
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = height ~ Class, data = DF2)

$Class
         diff        lwr      upr     p adj
B-A 0.2466061 -2.6510066 3.144219 0.9775584
C-A 2.8761599 -0.0214528 5.773773 0.0521622
C-B 2.6295538 -0.2680589 5.527167 0.0832488


 앞서 세 반의 키를 비교하는 예제입니다. P 값은 0.0364에서 세 반의 키의 평균에는 차이가 없다는 가설이 기각되었습니다. TukeyHSD의 결과값 해석은 

diff - 두 그룹의 차이
lwr - upr - 95% 신뢰구간 (CI)에서 하한값과 상한값. 
p adj - 두 그룹간 차이의 P값




 이를 표로 정리하면 


 B
 C
 A

0.2466061 (95% CI -2.6510066 - 3.144219)
P = 0.9775584
 2.8761599 (95% CI -0.0214528 - 5.773773)
P = 0.0521622
 B


2.6295538 (95% CI-0.2680589 5.527167)
P= 0.0832488
 C






  가 될 것입니다. 여기에서 당황스러운 부분이 분산 분석 결과와는 달리 사후 검정에서는 통계적으로 P<0 .05="" 50="" nbsp="" p="" span="">


> #n=50
> set.seed(1234)
> A<-rnorm span="">
> set.seed(123)
> B<-rnorm span="">
> set.seed(12345)
> C<-rnorm span="">
> DFA<-data .frame="" class="" height="" span="">
> colnames(DFA)<-c height="" lass="" span="">
> DFB<-data .frame="" class="" height="" span="">
> colnames(DFB)<-c height="" lass="" span="">
> DFC<-data .frame="" class="" height="" span="">
> colnames(DFC)<-c height="" lass="" span="">
> DF2<-rbind span="">
> out=aov(height~Class, data=DF2)
> summary(out)
             Df Sum Sq Mean Sq F value   Pr(>F)    
Class         2    447  223.56   9.436 0.000139 ***
Residuals   147   3483   23.69                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> TukeyHSD(out)
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = height ~ Class, data = DF2)

$Class
        diff        lwr      upr     p adj
B-A 1.437283 -0.8676389 3.742204 0.3051957
C-A 4.163096  1.8581747 6.468018 0.0001004
C-B 2.725814  0.4208919 5.030735 0.0158951


 이제 C,A, 그리고 C,B 반이 차이가 있고 A,B 반에는 차이가 없다는 결과가 나왔습니다. 샘플수가 커질수록 작은 차이도 통계적 유의성을 가지는 것이지요. 다른 가정에 문제가 없고 ANOVA에서 차이가 있는데, 사후 검정에서는 차이가 없는 것으로 나온다면 통계적 유의성을 확인하기에 샘플수가 적은 것이 원인일 가능성이 큽니다. 


 여기서 알 수 있는 사실은 P 값의 해석에 주의해야 한다는 점. 그리고 보통 교과서에서 잘 설명하지 않지만, 실제로 통계 분석을 해보면 당황스러운 일이 자주 생긴다는 점입니다. 



 참고 




첫 번째 엔진 테스트를 진행한 Stratolaunch





(Successful engine tests are another milestone crossed in the journey to getting this beast into the air(Credit: Dylan Schwartz))


 비행에 성공하면 역사상 가장 거대한 비행기로 기록될 스트라토런치 (Stratolaunch)가 엔진 테스트를 시작했다는 소식입니다. 너비 117m의 거대한 길이와 6개의 플랫 앤 휘트니 터보팬 엔진을 장착한 스트로토런치는 249,476 kg라는 엄청난 페이로드를 이용해서 성층권에서 거대 로켓을 발사하는 것이 목적입니다. 




 이 거대한 항공기와 로켓을 성층권까지 날려보낼 엔진은 중고 보잉 747-400 두 대에서 추출한 Pratt & Whitney PW4000 엔진으로 추력은 205–296 kN (46,000–66,500 lbf)에 달합니다. 하지만 2019년으로 예정된 첫 비행에 앞서 여러 가지 테스트가 필요합니다. 앞으로 몇 달간 지상에서 엔진 테스트가 진행될 것입니다. 


 아마도 이 항공기에서 가장 걱정되는 부분은 사실 엔진보다는 동체일 것입니다. 특히 가운데 날개가 무거운 하중을 잘 버틸 수 있을지 그리고 긴 날개가 비행 중 받는 힘을 잘 컨트롤 할 수 있을지가 관건입니다. 비행에만 성공해도 신기록을 세우는 셈이지만, 성공적으로 임무를 수행해서 우주 개발 부분에 새로운 바람을 불러일으킬 수 있을지가 가장 큰 관심사입니다. 


 과연 로켓 부분까지 완벽하게 테스트에 성공할 수 있을지 결과가 기대됩니다. 


 참고 





태양계 이야기 652 - 소행성대 생성에 대한 새로운 이론



(The asteroid belt may be have started out empty and was populated by objects from across the Solar System. Credit: Sean Raymond, planetplanet.net)


 보르도 대학(Université de Bordeaux)의 연구팀이 소행성대 생성에 대한 새로운 가설을 주장했습니다. 목성과 화성 사이에 존재하는 소행성대에는 큰 행성은 없고 작은 소행성들이 무수히 존재합니다. 그 생성 원인을 설명하는 이론은 바로 목성의 중력입니다. 목성의 강한 중력이 이 위치에서 미행성이 합체되어 새로운 행성이 생성되는 것을 방해했다는 것입니다. 이 이론이 옳다면 목성이 좀 더 안쪽 궤도를 공전했다면 화성이나 지구도 형성되기 어려웠을 것입니다. 


 그런데 한 가지 흥미로운 점은 소행성대 전체의 질량이 하나의 행성을 형성하기에는 너무 적다는 것입니다. 현재의 이론은 본래 소행성대에 위치한 물질의 99%가 목성의 중력에 의해 다른 곳으로 궤도를 옮기거나 혹은 목성에 흡수되었다고 보고 있습니다. 


 연구팀은 내행성에 가까운 소행성의 경우 암석 행성에 가까운 구성 (S type 소행성)인 반면 외행성에 가까운 소행성의 경우 가스 행성에 가까운 구성 (C type 소행성)이라는 점에 주목했습니다. 이는 목성의 중력으로만 설명하기 어려운 현상입니다. 


 연구팀의 새로운 가설은 실제로는 목성궤도 보다 먼 궤도에 있던 소행성이 안쪽으로 이동하거나 혹은 반대로 내행성 궤도에 있던 소행성이 궤도를 변경해 지금의 궤도로 이동했다는 것입니다. 이에 따르면 위치에 따른 소행성의 구성의 차이를 쉽게 설명할 수 있습니다. 하지만 진짜 이런 일이 발생했는지 입증할 근거는 아직 부족합니다. 


 소행성대의 기원을 밝히기 위해서는 역시 더 많은 연구가 필요합니다. 특히 소행성대 물질의 기원을 알기 위해 직접 샘플을 채취해서 조사할 필요가 있습니다. 앞으로 진행될 소행성 탐사에서 더 많은 정보가 얻어질 것으로 기대합니다. 


 참고 


More information: Sean N. Raymond et al. The empty primordial asteroid belt, Science Advances (2017). DOI: 10.1126/sciadv.1701138

2017년 9월 23일 토요일

공룡을 잡아먹던 개구리의 턱힘은?



(An individual Ceratophrys cranwelli biting a force transducer. Leather strips glued to ends of bite bars provide a natural surface that encourages high-effort biting and avoids damage to teeth and bones. The strips also indicate a bite point for standardization of bite-force performance. Credit: Scientific Reports (2017). DOI: 10.1038/s41598-017-11968-6)


 6800만년 전 마다가스카르 섬에는 역사상 가장 거대한 개구리 중 하나인 베엘제부포(Beelzebufo)가 살았습니다. 파리의 대왕으로 불리는 악마 베알제붑(Beelzebub)에서 이름을 따온 이 고대 양서류는 사실 대부분의 공룡처럼 크지는 않아서 몸길이 41cm에 체중은 4.5kg 정도였던 것으로 생각됩니다. 하지만 뱀을 잡아먹는 개구리가 현존하는 것처럼 작은 수각류 공룡이라면 잡아먹었을 가능성도 있습니다.


 아델레이드 대학을 비롯한 다기관 연구자 (University of Adelaide, California State Polytechnic University – Pomona, University of California – Riverside and UCL, University College London)들은 실제로 베엘제부포가 작은 공룡도 삼킬만큼 턱힘이 센지 검증했습니다. 


 대부분의 개구리는 파리처럼 작은 먹이를 선호하지만, 뿔개구리 (horned frog)의 경우 강한 턱힘과 큰 입을 이용해서 설치류, 뱀, 다른 개구리까지 잡아먹습니다. 베엘제부포가 현재의 뿔개구리와 많은 면에서 비슷하기 때문에 연구팀은 뿔개구리의 턱힘을 기준으로 삼아 연구를 진행했습니다. 가장 큰 뿔개구리의 경우 10cm 너비의 입에 500N에 강한 턱힘을 가지고 있습니다. 이 비율을 베엘제부포에 적용하면 2200N이라는 엄청난 힘을 지녔다는 추정이 가능합니다. 이는 늑대나 암컷 호랑이에 견줄 수 있는 수준입니다. 몸크기에 비해 상대적으로 큰 턱힘은 거대한 입과 연관이 있습니다. 


 연구팀은 이 결과를 바탕으로 베엘제부포가 처음 이를 발견한 연구자들의 생각처럼 실제로 작은 수각류 공룡을 잡아먹는데 문제가 없다는 결론을 내렸습니다. 작은 곤충 대신 큰 먹이를 잡아먹을 수 있는 능력 덕분에 베엘제부포가 이렇게 커질 수 있었을 것입니다. 어쩌면 백악기에 이보다 더 거대한 개구리가 있었는데, 아직 우리가 모르고 있을수도 있습니다. 


 백악기는 분명 공룡의 시대지만, 이 시대에 살았던 흥미로운 생물이 공룡만은 아닐 것입니다. 


 참고 



 A. Kristopher Lappin et al. Bite force in the horned frog (Ceratophrys cranwelli) with implications for extinct giant frogs, Scientific Reports (2017). DOI: 10.1038/s41598-017-11968-6



식물 광합성만큼 에너지 전환 효율이 우수한 인공 광합성



(Schematic of a solar-powered electrolysis cell which converts carbon dioxide into hydrocarbon and oxygenate products with an efficiency far higher than natural photosynthesis. Power-matching electronics allow the system to operate over a range of sun conditions. Credit: Clarissa Towle/Berkeley Lab)


 앞서 여러 차례 소개드린 것과 같이 과학자들은 이산화탄소를 원료로 더 유용한 탄화수소 물질을 생산하는 연구를 진행 중입니다. 앞서 소개한 미국 에너지부 산하의 로렌스 버클리 국립 연구소 (Lawrence Berkeley National Laboratory)의 연구팀과 다른 연구팀이 이전과는 약간 다른 관점에서 새로운 이산화탄소 변환 방법을 개발했습니다. 그것은 태양전지에서 나온 전기 에너지를 이용해서 이산화탄소로 에탄올과 에틸렌을 만드는 방법 태양전지 - 화학 반응 전지입니다. 


 물론 이전에도 비슷한 전기화학 반응이 개발된 바 있으나 이번 연구에서는 일산화탄소 같은 중간 단계없이 바로 이산화탄소에서 탄화수소 결과물을 만들 수 있으며 이에 따라 에너지 변환 효율 역시 높아졌다는 차이가 있습니다. 


 이런 태양 - 연료 과정 (sun-to-fuel path)은 에너지부의 인공 광합성 연구센터 Joint Center for Artificial Photosynthesis (JCAP)의 핵심 목표로 태양에너지를 이용해서 이산화탄소를 탄화수소로 바꾸기 때문에 이름 그대로 인공 광합성이라고 할 수 있습니다. 문제는 효율이 낮고 비용이 비싸다는 점이었습니다. 


 JCAP의 연구팀은 태양이 가장 밝은 정오 뿐 아니라 빛이 약한 상황에서도 높은 효율을 지닌 태양전지 - 화학 반응 시스템을 개발했습니다. 고효율의 태양광 전지를 사용하는 경우 에너지 전환 효율은 5%에 달해 식물 광합성에 견줄만 하거나 오히려 더 높은 수준입니다. 이는 인공 광합성 연구에서 중요한 이정표를 세운 것입니다. 


 핵심은 물과 이산화탄소를 탄화수소로 바꾸는 전극으로 구리 - 은 나노코랄 음극에서 이산화탄소를 탄화수소와 산화물로 만들고 산화이리듐 나노튜브 양극에서 물에서 산소를 분리합니다. (a copper-silver nanocoral cathode, which reduces the carbon dioxide to hydrocarbons and oxygenates, and an iridium oxide nanotube anode, which oxidizes the water and creates oxygen)


  물론 아직 상업화까지는 많은 시간이 필요하겠지만, 자연계의 광합성(대략 3-6%)보다 효율이 높은 인공 광합성의 가능성을 보였다는 점에서는 의의가 적지 않을 것 같습니다. 현재 사용되는 바이오연료는 광합성 에너지의 극히 일부만을 사용하는 비효율성을 가지고 있습니다. 광합성으로 식물도 에너지를 사용해야 하고 식물의 경우 줄기, 잎, 뿌리 등 다양한 부분을 만들어야 하기 때문에 당연히 광합성 에너지의 대부분은 인간이 회수하기 어렵습니다. 하지만 인공 광합성을 통해 중간 단계 없이 바로 탄화수소를 얻을 수 있다면 그 효율은 대단히 높아질 것으로 기대할 수 있습니다. 


 과연 경제적인 생산이 가능할지 결과가 주목됩니다. 


 참고 


More information: Gurudayal Gurudayal et al, Efficient solar-driven electrochemical CO2 reduction to hydrocarbons and oxygenates, Energy Environ. Sci. (2017). DOI: 10.1039/c7ee01764b




태양계 이야기 651 - 두 개로 쪼개진 혜성 혹은 소행성



(This time-lapse video, assembled from a set of Hubble Space Telescope photos, reveals two asteroids orbiting each other that have comet-like features. The asteroid pair, called 2006 VW139/288P, was observed in September 2016, just before the asteroid made its closest approach to the Sun. The photos revealed ongoing activity in the binary system. The apparent movement of the tail is a projection effect due to the relative alignment between the Sun, Earth, and 2006 VW139/288P changing between observations. The tail orientation is also affected by a change in the particle size. Initially, the tail was pointing towards the direction where comparatively large (about 1 millimeter in size) dust particles were emitted in late July. However, from Sept. 20 on, the tail began to point in the opposite direction from the Sun as the pressure of sunlight affects smaller (10 microns in size) dust particles where they are blown away from the nucleus by radiation pressure. Credits: NASA, ESA, and J. DePasquale and Z. Levay (STScI))


(Hubble photographed a pair of asteroids orbiting each other that have a tail of dust, which is a comet-like feature. The odd object, called 2006 VW139/288P, is the first known binary asteroid that is also classified as a main-belt comet. Roughly 5,000 years ago, 2006 VW139/288P probably broke into two pieces due to a fast rotation.
Credits: NASA, ESA, and J. Agarwal (Max Planck Institute for Solar System Research))


 빠르게 자전하는 소행성이나 혜성이 두 개로 쪼개질 수도 있을까요? 이론적으로 얼마든지 가능한 일이지만, 실제로도 그런 일이 있었다는 증거가 발견되었습니다. 2006년 발견된 소행성 300163 (2006 VW139)은 2011년 Pan-STARRS 및 Spacewatch 관측 프로그램에서 혜성 활동의 증거가 발견되어 288P라는 명칭이 붙어 있습니다. 


 주소행성대에 위치한 이 천체는 혜성 같은 증발 활동을 보이는 소행성으로 2006 VW139/288P라는 복합적인 명칭을 가지고 있습니다. 허블 우주 망원경 관측 결과 밝혀진 놀라운 사실은 한 개가 아니라 두 개의 소행성이라는 점입니다. 대략 100km 거리에 떨어진 두 개의 천체는 주 소행성대에서 처음 발견된 쌍소행성 (binary asteroid)이라고 합니다. 


 연구의 리더인 막스 플랑크 연구소의 제시카 아가왈(Jessica Agarwal of the Max Planck Institute for Solar System Research)을 비롯한 연구자들에 의하면 이 쌍소행성은 사실 생성된지 5000년 정도밖에 되지 않은 것이라고 합니다. 인간의 관점으로는 긴 세월이지만, 천문학적 스케일로 보면 방금 전이라고 할 수 있는 수준입니다. 


 가장 가능성 있는 생성 이론은 빠른 속도로 자전하던 천체가 결국 두 개로 쪼개진 후 승화(ice sublimation, 드라이 아이스처럼 얼음에서 바로 기체가 되는 것)되면서 점차 질량과 중력을 잃어 거리가 멀어진 것입니다. 물론 처음에 쪼개진 것 역시 승화되면서 구조가 약해진 것과 관련이 있을지도 모릅니다. 


 아무튼 기체를 내뿜으면서 서로 공전하는 소행성 혹은 혜성은 태양계에서 가장 기묘한 천체 가운데 하나일 것입니다. 허블 망원경의 높은 해상력 덕분에 우리는 그 실체를 파악할 수 있었습니다. 앞으로 건설될 차세대 망원경을 통해서 더 자세한 이해가 가능할 것으로 기대합니다. 


 참고 


2017년 9월 22일 금요일

희귀 동물의 상업적 판매가 밀렵을 막을 수 있을까?




 인간의 의한 서식지 파괴와 남획, 그리고 밀렵으로 인해 수많은 동식물이 이미 사라졌거나 사라질 위기에 처해 있습니다. 멸종을 막기 위해 서식지를 보존하려는 노력에도 불구하고 일부 동식물은 밀렵으로 인해 개체수가 자꾸 줄어들고 있습니다. 따라서 이를 근본적으로 해결하기 위해서는 밀렵을 감시하는 것만이 아니라 다른 접근이 필요하다는 주장이 나오고 있습니다. 


 에콰도르에 위치한 위키리(Wikiri)는 2011년부터 12종의 희귀한 개구리를 상업적으로 번식시켜 판매하고 있습니다. 연간 500마리의 개구리가 판매되며 가장 비싼 것은 600달러 수준이라고 합니다. 사실 판매가 목적이기보다는 개구리 종을 보호하는 쪽이 더 큰 목적이라고 할 수 있는데, 이 회사가 위치한 곳이 바로 에콰도르의 양서류 연구 기관인 잠바투 양서류 연구 및 보존 센터(Jambatu Center for Research and Conservation of Amphibians)이기 때문입니다. 




(동영상) 


 에콰도르는 큰 나라는 아니지만, 전 세계에서 가장 양서류가 다양하게 분포하는 지역 가운데 하나입니다. 적어도 570종의 양서류가 확인되었고 이 중 257종은 오직 에콰도르에서만 발견됩니다. 잠바투 연구소는 지난 30년간 이들을 연구하고 보존하기 위해 노력했으며 일부 희귀종의 경우 실험실에서 번식에 성공했습니다. 


 이들이 판매에 나선 이유는 불법적인 거래를 막기 위한 것입니다. 실험실에서 비교적 저렴한 가격에 합법적으로 판매한다면 잡힐 위험을 감수하고 구하기도 힘든 야생 개구리를 잡으려고 노력하는 사람이 줄어들 것이라는 논리입니다. 


 이론적으론 그럴듯하긴 하지만 여기에는 한 가지 문제점이 존재합니다. 잘못하면 불법적으로 포획된 희귀종이나 혹은 보호종의 일부 (뿔이나 가죽 등)가 합법적 물건으로 둔갑해서 판매될 위험성이 존재하기 때문입니다. 


 따라서 천편일률적으로 적용하기는 힘들지만, 일부 희귀종에 대해서는 긍정적으로 검토해야 하지 않을까 생각합니다. 정말 잡기 힘든 희귀한 동식물이라면 이를 보호하는 측면에서 일부는 인공 번식을 시도해서 자연에 방사하고 나머지는 판매하는 방식으로 밀렵도 막고 종도 보존하는 방법이 가능할 것입니다. 밀렵꾼도 잡기 힘든 동식물을 싼 값에 팔고 싶지는 않을 것입니다. 반면 비교적 잡기 쉽지만 보호종인 경우 엄격한 규제가 필요할 것입니다. 


 모두가 만족할 수 있는 완벽한 방법은 없겠지만, 최소한 아무것도 하지 않는 것보다는 더 나은 조치가 아닌가 생각합니다. 


 참고