본문 바로가기

Hadoop Ecosystem

(23)
RHadoop log Error 발생 Error in mr(map = map, reduce = reduce, combine = combine, vectorized.reduce, : hadoop streaming failed with error code 1 2013-06-27 20:18:13,019 INFO org.apache.hadoop.mapred.TaskInProgress: Error from attempt_201306271950_0003_m_000000_0: java.lang.RuntimeException: PipeMapRed.waitOutputThreads(): subprocess failed with code 1 [refered to http://blrunner.com/23] ./bin/hadoop jar contr..
RStudio-server version install http://www.wsyang.com/2011/04/%EC%83%88%EB%A1%9C%EC%9A%B4-r%EC%9D%98-%ED%86%B5%ED%95%A9%ED%99%98%EA%B2%BD-rstudio/ C:\Windows\System32\drivers\etc Default rstudio server port : 8787http://www.rstudio.com/ide/docs/server/configurationhttp://www.rstudio.com/ide/docs/server/management Starting RStudio-server#/etc/init.d/rstudioserver start R>Sys.setenv(HADOOP_HOME="/home/hadoop/hadoop/")R>Sys.seten..
R installation on Centos 제목 : R installation on Centos [ 2013-05-13 ] http://cafe.naver.com/sqlpd/2202 -- 카페에 올렸던 글임. Error message : ...... X11 headers/libs are not availableR version : R-2.15.2.tar.gzOS : Centos 6.4 Kernel Linux 2.6.32-358.el6.x86_64 R 은 Windows 상에서만 설치하여 MongoDB 데이타를 import 하는 것 까지 성공확인 이후스터디 때 사용해 오다가 결국은 R 도 Linux 상에서 쓰는것이 맞지 않을까 싶어 Linux 에서 설치시도 들어갔네요. 그런데 이거 Windows 에서 설치하는 것과 달리 하나하나가 걸림돌이네요 혹시 ..
[hadoop@h001 ~]$ cat .hivehistory with 항공데이터 [hadoop@h001 ~]$ cat .hivehistory show tables;show databases;show databases; create table jtemp01 (a int, b string);create table jtmep01_invites (a int, b string) partitioned by (cs string); describe jtemp01;describe jtemp01_invites;alter table jtemp01 add columns (new_col int);alter table invites add columns ( new_col2 int comment 'aaaa comment');alter table jtmep01_invites add columns( new_col..
HIVE 상에서 사용할 수 있는 명령어 HIVE 상에서 사용할 수 있는 명령어 ! != $ELEM$$KEY$ $VALUE$ $elem$$key$ $value$ %& ( )); * +, - ./ : = ADD ALLALTER AND ARRAYAS ASC BIGINTBINARY BOOLEAN BUCKETBUCKETS BY CASTCLUSTER CLUSTERED COLLECTIONCOLUMNS COMMENT CREATEDATA DATE DATETIMEDELIMITED DESC DESCRIBEDIRECTORY DISTINCT DISTRIBUTEDOUBLE DROP EXPLAINEXTENDED EXTERNAL FALSEFIELDS FLOAT FORMATFROM FULL FUNCTIONGROUP INPATH INPUTFORMATINSERT INT INT..
What Is Apache Hadoop? http://hadoop.apache.org/ What Is Apache Hadoop? The Apache™ Hadoop™ project develops open-source software for reliable, scalable, distributed computing. The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using a simple programming model. It is designed to scale up from single servers to thousands of machin..
하둡(Hadoop)이나 NoSQL, H베이스(HBase) ,리눅스나 아파치 메일 서버 등의 운영체제(OS) 이외에도 톰캣(Tomcat)이나 제이보스(JBoss), 포스트그레SQL(PostgreSQL), 마이SQL 최근 클라우드 컴퓨팅 환경으로의 전환 추세 등과 맞물려 국내에도 오픈소스 소프트웨어(OSS) 열풍이 높아지고 있다. 이는 전세계적인 추세와 별반 다르지 않다. 유독 신제품이나 신기술 도입에 보수적이라는 일본이라고 해서 예외는 아니다. 다른 나라들에 비해 신제품을 공급하는 데 유난히 문턱이 높다는 일본 기업들 역시 최근 개발·운영비용 절감 이슈와 IT기업에 종속되는 상황(Vendor Lock-in)에서 벗어나기 위해 OSS 도입에 적극적인 모양새를 취하고 있다. 국내 기업들을 대상으로 일본 기업들의 OSS 도입 사례를 발표하기 위해 최근 방한한 미즈노 히로미치 HP 재팬 테크놀로지 컨설팅 부문 데이터센터 솔루션 서비스 컨설턴트은 “흔히 OSS라고 하면 품질이나 유지보수 서비스 등에 대한 불안감을 느끼는 고..