본문 바로가기
728x90

분류 전체보기230

[Spark] Spark 개념 참고 : http://www.itworld.co.kr/insight/147556 스파크란? 스파크는 빅데이터 워크로드에 주로 사용되는 분산처리 시스템이며 하둡과 마찬가지로 오픈소스 입니다. 특징은 빠른 성능을 위해 인 메모리 캐싱과 최적화 된 실행을 사용하고 일반 배치처리, 스트리밍 분석, 머신러닝, 그래프 데이터 베이스 및 임시 쿼리를 지원 하둡없이도 클라우드 기반 데이터 플랫폼과 융합하며 원래는 하둡을 이용한 정보활용을 위한 데이터 프로세싱 툴입니다. 기존의 하둡을 통해 끌어오는 데이터들은 시간 소요가 크기 때문에 실시간으로 분석해야 하는 업무에서는 어려운 부분이 있어 새로이 개발 되었구요. 함수형 프로그래밍이 가능한 언어 스칼라(Scala)를 사용해 간단한 코드로 인터렉티브 쉘(Interactive.. 2020. 7. 2.
[Hadoop] Hadoop 개념 ‘하둡’이라는 이름이 어디서 왔는고 하니, 바로 이 더그 커팅의 아들이 갖고 놀던 노란 코끼리 봉제 인형에서 유래했다고 합니다. 더그 커팅은 아들이 이 노란 코끼리를 발음하는 것을 듣고 이름을 ‘하둡’으로 지었다고 합니다. 1. Hadoop 하둡이란? 하둡은 대용량 데이터를 분산 처리할 수 있는 자바 기반의 오픈소스 프레임워크 입니다. 대용량 파일을 저장할 수 있는 기능을 제공하는 분산파일 시스템(HDFS)과, 저장된 파일을 분산된 서버의 CPU와 메모리 자원을 이용하여 빠르게 분석하는 맵리듀스 플랫폼으로 구성되어 있다. 하둡은 아파치 루씬 창업자인 더그 커팅이 2006년 야후 엔지니어로 일하면서 개발 분산 프로그래밍이란? 간단히 말해 여러 디스크로부터 데이터를 한번에 읽는 것을 말합니다. 사실 하드디스.. 2020. 7. 2.
[금융뉴스] [21대 총선] 여당 압승한 21대 선거, 향후 핀테크 정책 향방은? 금융권에서 주목하는 것은 우선 인터넷전문은행법의 통과 여부다. 21대 국회가 5월 출범할 예정인 가운데 4월 말까지 20대 국회 마지막 임시회 기간 중 인터넷전문은행법 처리가 다시 시도된다. 민주당은 임시회 중 인터넷은행법의 국회통과를 추진키로 한 바 있다. 인터넷은행법 개정안은 인터넷은행 대주주 자격 요건을 완화하는 내용이 핵심이다. 대주주적격성 평가에 있어 법에서 정한 한도를 초과해 지분을 보유하려는 주주는 최근 5년간 금융 관련 법령을 비롯해 벌금형 이상의 형사처벌을 받은 사실이 없어야 하는데 여기에 케이뱅크가 걸려 있다. 모기업인 KT의 벌금형 처벌이 발목을 잡고 있는 셈이다. 업계에선 우선 카카오뱅크 공동대표였던 이용우 더불어민주당 경기 고양정 당선인의 행보에도 주목하고 있다. 여기에 데이터3법.. 2020. 4. 20.
DL (Data Lake) 데이터 호수(Data Lake) :데이터 호수(Data Lake)는 시스템 또는 자연적인 형식으로 저장된 데이터 저장소이며, 일반적으로 소스 시스템 데이터의 원시 사본 및 보고, 시각화, 분석 및 기계 학습(Machine Learning)과 같은 작업에 사용되는 변환된 데이터를 포함하여 모든 엔터프라이즈 데이터의 단일 저장소이다. 데이터 호수에는 관계형 데이터베이스(행과 열), 반 구조화 된 데이터(CSV, 로그, XML, JSON), 구조화되지 않은 데이터(전자 메일, 문서, PDF) 및 바이너리 데이터(이미지, 오디오, 비디오)의 구조화된 데이터가 포함될 수 있다. 데이터 웨어하우스 vs 데이터 레이크 데이터 웨어하우스와는 다르게 데이터 레이크는 데이터의 종류를 묻지도 따지지도 말고 저장하는 공간이다.. 2020. 4. 20.
DM (Data Mart) DM (Data Mart) : 데이터 웨어하우스와 사용자 사이의 중간층에 위치한 것으로, 하나의 주제 또는 하나의 부서 중심의 데이터 웨어하우스라고 할 수 있다. 전사적으로 구축된 데이터 웨어하우스로부터 특정 주제, 부서 중심으로 구축된 소규모 단일 주제의 데이터 웨어하우스이다. 데이터 마트 내 대부분의 데이터는 데이터 웨어하우스로부터 복제되지만, 자체적으로 수집될 수도 있으며, 관계형 데이터 베이스나 다차원 데이터 베이스를 이용하여 구축한다. 즉, 일반적인 데이터베이스 형태로 갖고 있는 다양한 정보를 사용자의 요구 항목에 따라 체계적으로 분석하여 기업의 경영 활동을 돕기 위한 시스템을 말한다. 데이터 웨어하우스는 정부 기관 또는 정부 전체의 상세 데이터를 포함하는 데 비해, 데이터 마트는 전체적인 데이.. 2020. 4. 20.
OLTP / OLAP OLTP (On-line Transaction Precessing) : 온라인 트랜잭션 처리 여러 과정의 연산이 하나의 단위 프로세스(트랜잭션)로 실행되도록하는 처리이다. 네트워크상의 여러 이용자가 실시간으로 데이터베이스의 데이터를 갱신하거나 조회하는 등의 단위 작업을 처리하는 방식을 말한다. 주로 신용카드 조회 업무나 자동 현금 지급 등 금융 전산 관련 부문에서 많이 발생하기 때문에 ‘온라인 거래처리’라고도 한다. 이 방식의 특징은 기존 컴퓨터 통신에서 이용해 온 온라인 방식과 달리 다수의 이용자가 거의 동시에 이용할 수 있도록 송수신 자료를 트랜잭션(데이터 파일의 내용에 영향을 미치는 거래 ·입출고 ·저장 등의 단위 행위) 단위로 압축, 비어 있는 공간을 다른 사용자들이 함께 쓸 수 있도록 한 점이다.. 2020. 4. 20.
ETL (Extract, Transform, Load) ETL (Extract, Transform, Load) : 저장된 데이터를 추출하고 변형하여(요구사항에 맞게) 다른 곳으로 적재하는 모든 과정 Extract : 테이블에서 데이터를 추출 Transform : 추출한 데이터를 요구하는 형태로 변형 (필터링, 정렬, 집계, 데이터 조인, 데이터 정리, 중복 제거 및 데이터 유효성 검사 등) Load : 변경된 데이터를 테이블에 적재 OLTP에서 DW, DM, OLAP에 이르기까지의 과정에서 중간 중간에서 데이터를 이관하는 과정을 모두 ETL이라고 한다. 다음 그림과 같이 중간에 변형작업에서 주로 하는 일은 바로 정제이다. OLTP에서 발생한 데이터를 그대로 이관하여 DW, DM을 만들게 될 때 가장 먼저 부딪히는 벽이 바로 데이터의 정합성 문제이다. 이를 해.. 2020. 4. 20.
DW (Data Warehouse) DW(Data Warehouse) : Raw Data를 통한 분석자료를 제공하여 조직 내 의사결정을 지원하는 정보관리 시스템 DW 4가지 특성 주제지향(Subject Oriented): data를 categorizing하여 End User에게 이해하기 쉬운 형태 제공 통합(Integrated): raw data를 일관적인 포맷으로 변환하여 저장 시계열(Time Variant): DW내의 data는 일정기간동안 정확성을 나타낸다. 비휘발성(Nonvolatile): DW에 적재 후 일괄처리(batch) 작업에 의한 갱신 이외에는 삽입, 삭제 등의 변경이 수행되지 않는다. AWS는 DW를 3가지 티어로 나눔 하단티어 : DB Server 중간티어 : data를 액세스하고 분석하는 데 사용되는 분석 엔진으로 구.. 2020. 4. 20.
[금융뉴스] 코로나19에 규제 예고까지...잇단 악재에 신음하는 금융권 계속된 악재로 신음하고 있다. 당장 코로나19 여파로 올해 1분기 수익이 감소될 것으로 보이는 가운데 앞으로 전망도 어두울 것으로 예상된다. 여기에 이번 21대 총선에서 승리한 더불어민주당이 금융소비자 보호 목적를 위해 관련 규제를 강화를 예고하면서 영업 활동마저 쉽지 않을 것으로 보인다. 17일 금융권에 따르면 더불어민주당이 ‘금융소비자보호법(금소법)’ 보완 조치로 징벌적 손해배상과 소비자 집단소송제 등의 도입을 검토하고 있다. 금소법은 '금융소비자의 권익 증진과 금융상품판매업 및 금융상품자문업의 건전한 시장질서 구축' 등을 목적으로 마련된 법이다. 실적 하락 원인은 금융지주의 주력 자회사인 은행의 수익성 지표 악화가 꼽힌다. 최근 한국은행이 기준금리를 50bp(1bp=0.01%포인트) 인하하면서 은행.. 2020. 4. 19.
[금융뉴스] 딜라이트닷넷: 빅데이터 부수업무 허용, 마이데이터 시장 전초전 개화 마이데이터에 대한 금융사들의 준비가 얼마나 충실하게 이뤄져 왔는지 본격적인 심판을 받게 되는 시점이 다가오고 있다. 지난 4월 9일 금융위원회가 신한은행이 신청한 빅데이터 부수업무 신고를 수리하면서 다른 은행도 ‘빅데이터 부수업무’를 신고 없이 영위할 수 있게 됐다. 이번 부수업무는 은행이 보유하고 있는 고객의 개인신용정보를 빅데이터(가명정보, 익명정보, 통계정보 등)로 변환 후, 빅데이터 분석을 통해 상권분석, 마케팅 전략 등에 관한 자문 서비스 및 관련 빅데이터 제공하는 것을 내용으로 한다. 즉, 은행 차원에서 빅데이터 컨설팅 및 데이터셋 판매가 가능해진 셈이다. .... PFMS 시장이 본격 개화할 것으로 보이는 가운데 은행들의 경쟁도 뜨거워질 전망이다. 문제는 차별성이다. 빅데이터 부수업무 허용으.. 2020. 4. 16.
[금융뉴스] BC카드, 공공 빅데이터 사업 참여 BC카드(대표이사 사장 이동면)가 과학기술정보통신부(이하 과기정통부)와 데이터산업진흥원이 주관하는 ‘데이터바우처 지원사업’을 통해 소상공인 지원에 적극 나서고 있다. ‘데이터바우처 지원사업’은 빅데이터 활용을 통한 신제품과 서비스 개발이 필요한 기업에 데이터 구매·가공 서비스를 바우처로 지급하는 사업이다. 주로 인력, 자금 등에 어려움을 겪고 있는 중소기업, 소상공인, 스타트업 등이 지원대상 이다. BC카드는 작년 업계 최초로 데이터바우처 지원사업 데이터·가공서비스 공급기업으로 선정됐다. 매월 35개 고객사에서 약 4억건 규모의 카드 결제 데이터가 축적되고 있으며, 국내 최대 규모인 310만 가맹점 인프라 기반 매출 데이터도 보유하고 있다. 이러한 빅데이터 역량을 바탕으로 양질의 빅데이터를 공급하고 이를.. 2020. 4. 15.
[금융뉴스] 한국은행, 중앙은행 디지털화폐 연구 및 파일럿 시스템 구축 착수 한국은행이 중앙은행 디지털화폐(CBDC) 도입 필요성이 높아질 수 있는 미래의 지급결제 환경 변화에 대응하기 위해 CBDC 도입을 위한 파일럿 시스템 구축에 나섰다. 한국은행은 6일 CBDC 도입에 따른 기술적, 법률적 필요사항을 사전적으로 검토하는 한편, 파일럿 시스템 구축 및 테스트를 진행하기 위한 연구 추진 계획을 수립, 추진하고 있다고 밝혔다. 그동안 에콰도르, 우루과이 등 주로 개발도상국에서 금융포용 제고를 목적으로 CBDC 시범 발행을 추진해 왔지만 최근에는 스웨덴, 중국 등이 현금 이용 감소, 민간 디지털화폐 출현 등에 대응해 CBDC 발행 준비에 적극 나서고 있다. 또, 가까운 장래에 CBDC 발행계획이 없다고 밝혔던 미국, 일본 등도 관련 연구를 강화하겠다는 입장으로 선회하는 추세다. 이.. 2020. 4. 7.
[금융뉴스] 우리은행, '비정형 빅데이터' 활용 획기적 개선…'하둡' 연계 EDW 본격 가동 우리은행이 기존과 비교해 훨등한 데이터 분석 능력을 갖추게 됨으로써 보다 적극적으로 데이터 기반의 비즈니스 전략을 기대할 수 있게 됐다.. 우리은행(은행장 권광석)은 국내 은행에서는 처음으로 빅데이터 플랫폼과 EDW(전사 데이터웨어하우스)를 결합한 하이브리드형 DW(Data Warehouse) 아키텍처 구축 프로젝트를 성공적으로 완료했다고 3일 밝혔다. 은행측에 따르면, '하둡(Hadoop)'분산정보 저장시스템과 기존 EDW를 통합해 다양하고 많은 정보를 저장할 수 있는 데이터레이크(Data Lake)를 새롭게 구축한 것이 이번 프로젝트의 핵심 내용이다. 우리은행측은 이를 통해 데이터 중복 적재에 따른 자원 낭비를 해소하고 데이터 분석, 설계, 서비스 구현 등에서 50% 이상 속도를 높였다고 설명했다. .. 2020. 4. 4.
[금융뉴스] 핀크, 돈 버는 송금 ‘플러스 송금’ 오픈 핀크(Finnq, 대표이사 권영탁)가 송금만 해도 100원씩 지급하고 수취인이 핀크에 최초 가입할 때마다 1천 원을 제공해 최대 1백만 원의 혜택을 볼 수 있는 ‘플러스 송금’을 선보였다. 핀크는 플러스 송금을 통해 돈을 보내는 송금의 원개념에서 벗어나 고객이 송금하면서 돈을 벌 수 있도록 총 세 가지의 파괴적 혁신 혜택을 마련했다. 먼저 핀크 앱에서 핀크 송금, T전화송금 등 핀크의 다양한 송금 서비스를 이용해 이체할 때마다 100원을 지급한다. 여기에 전화번호를 이용해 이체하는 연락처 송금 시 송금받는 친구가 핀크에 최초 가입하면 송금인과 수취인 모두에게 1천 원을 지급한다. 고객별 월 999회에 한하여 최대 999천 원을 제공하며, 송금 시 1백 원 지급 이벤트와 함께 월 최대 1백만 원의 혜택을 .. 2020. 4. 2.
[금융IT용어] 코봇 / 멀버타이징 / 옴니프레즌스 / 딥러닝 1. 코봇 Cobot Collaborative + Robot 의 합성어. 코봇은 사람들을 도와주는 '협업로봇'이다. 사람이 하는 일을 성공적으로 수행할 수 있도록 돕는 역할을 한다. 산업 현장에서는 사람이 하기 어려운 위험한 업무나 반복적인 작업을 수행하는 등 생산성 향상에 기여할 수 있다. 코봇은 다양한 곳에서 활용될 수 있다. 글로벌 자동차 기업인 포드 공장에서 코봇이 재료손질, 용접등의 업무를 수행하며 자동차 생산 작업을 돕고 있다. 또한 아마존 창고에서는 무거운 짐을 작업대까지 옮기는 역할을 하는 등 앞으로의 활약이 기대되고 있다. 2. 멀버타이징 Malvertising Malicious + Advertising 의 합성어. 멀버타이징은 온라인 광고를 이용해 사용자에게 악성코드를 유포하고 감염시키.. 2020. 4. 1.
[금융IT용어] 다크데이터 / 스피어피싱 / 인슈어테크 1. 다크데이터 정보를 수집했으나, 사용하지 않은 채 방치된 데이터를 다크데이터라고 한다. 사람의 몸짓, 함성, 목소리처럼 분석이 어렵거나 사용하기 어려운 비정형 데이터를 의미한다. 최근 IBM은 인공지능 '왓슨'을 활용해 관중 함성, 선수 제스터를 분석한 스포츠 하이라이트 영상을 선보였다. 앞으로 다크 데이터는 다방면에 활용될 것으로 기대된다. 2. 스피어 피싱 (Spear Phishing) 스피어 피싱이란 물속에서 작살을 이용해 물고기를 잡는 작살낚시에서 유래된 용어이다. 불특정 다수를 대상으로 한 일반적인 해킹이 아니라 특정한 개읹어보나 기밀 정보를 빼내기 위해 행해지는 해커의 공격을 말한다. 목적을 갖고 행하는 해킹으로써, 흔히 국가기관이나 주요 기업의 특정 기밀 정보를 탈취한다. 조직 전체에 피.. 2020. 4. 1.
[금융IT용어] 카푸치노 효과 / 페어트레이딩/ 전자금융거래법 /디지털트랜스포메이션 1. 카푸치노 효과 Cappuccino effect 카푸치노 효과란, 카푸치노의 이미지에서 연상되는 것처럼 재화가 실제의 가치보다 터무니없이 높게 책정된 시장의 거품을 말합니다. 쉽게 말해 ‘버블경제’를 의미한다. 경기가 끝없이 하락하는데도 유독 가격이 급등하며 과열되는 부동산 시장에 주로 적용되는 금융용어이다. 카푸치노 효과로 인한 결과는 신용경제와 실물경제 사이의 커다란 괴리 현상이라고 할 수 있다. 호재가 예상되는 지역의 아파트 가격이 급등해 실질적인 시세 이상의 대출로 무리하게 아파트를 사들인 후 시세가 급하락하면서 하우스푸어로 전락하는 경우를 흔히 보게 되는데, 이로 인해 시민 경제는 악화될 수밖에 없죠. 최근 비트코인 시장 역시 이 같은 현상을 겪고 있어 대책이 필요한 상황이다. 2. 페어트레.. 2020. 4. 1.
[금융IT용어] DID / 애그테크 / 스몰 라이선스 / 스푸핑 1. DID(Decentralized Identity) 존 신원확인 방식과 달리 중앙 시스템에 의해 통제되지 않으며 개개인이 자신의 정보에 완전한 통제권을 가질 수 있게 하는 기술이다. 분산신원확인 또는 탈중앙화 신원확인이라고도 한다. 대표적인 분산아이디 서비스로는 한국의 주요 통신사와 은행들이 연합한 이니셜(Initial),아이콘루프 를 중심으로 한 마이아이디(MyID) 서비스 등이 있다. 분산ID는 블록체인을 기반으로 한 신분증이다. 이용자 스스로 자신의 신원정보를 관리하고 통제할 수 있도록 하는 디지털화된 신원관리 체계다. 우리가 지갑에 주민등록증을 보관하고 필요할 때 꺼내 나를 증명하는 것처럼, 개인 블록체인 월렛에 내 개인정보를 담아 필요한 때 개인키를 입력해 나를 증명하는 것이다. (개인)정보.. 2020. 4. 1.
[금융뉴스] 신한은행, ‘안티-피싱 플랫폼’ 시행 신한은행(은행장 진옥동)은 전기통신금융사기로부터의 고객 보호를 강화하기 위해 ‘안티피싱(Anti phishing) 플랫폼’을 이행하고 모니터링 시스템을 대폭 업그레이드 했다고 31일 밝혔다. 신한은행 ‘Anti-피싱 플랫폼’은 개선된 시스템을 통해 의심거래 판단 속도를 높이고 최근까지 누적된 전기통신금융사기 거래 데이터들과 AI기술을 활용해 금융사기 거래에 대한 분석 능력을 고도화 시킨 모니터링 시스템이다. 신한은행은 지난 2월부터 2개월간 성공적으로 ‘Anti-피싱 플랫폼’을 시범 운영 했으며 4월 1일부터 정식 운영을 시작한다. ‘Anti-피싱 플랫폼’의 모니터링 기능은 여러가지 부분에서 크게 향상 됐는데 우선 신한은행은 금융사기 거래에 대한 신속한 판단을 위해 고객정보, 의심거래정보 등을 한눈에 파.. 2020. 4. 1.
[금융뉴스] 금융권 데이터 공개, 거대 포털도 개방해야 올 하반기 간편결제·송금, 계좌기반의 다양한 서비스가 가능한 금융 플랫폼 육성을 위해 ‘종합지급결제사업자’와 ‘마이페이먼트(MyPayment)’가 도입된다. 여기에 오는 8월부터 시행되는 데이터 3법에 따라 마이데이터, 전문·특화 신용조회회사 등 데이터 신산업 창출에 본격적으로 나선다. 이는 불과 몇 년 전까지도 가능 여부 자체를 생각하지 못했을 정도의 파격이다. 국내 금융사와 스타트업 등에게 혁신적인 조침이라는 것이 분명하다. 정책당국이 지켜주는 금융에서 열리는 금융으로 전환되는 시발점이라는 얘기도 나온다. 금융위원회는 오는 4월 초부터 금융위 및 금융공공기관이 보유하고 있는 데이터 중 상호 연계ㆍ융복합한 4400만 건의 금융공공데이터를 오픈 API 형태로 외부에 개방하는 서비스를 시작할 예정이다. 한.. 2020. 4. 1.
728x90