플래티어 연구소 테크 블로그
    • 메뉴 닫기
    • 글작성
    • 방명록
    • 환경설정
      • 분류 전체보기 (470)
        • Ai Word 사전 (0)
        • A.I.(인공지능) & M.L.(머신러닝) (94)
          • Development Environments (9)
          • A.I. Information (14)
          • Python (6)
          • transformers (13)
          • 머신러닝 (1)
          • 딥러닝 (4)
          • 신경망 이론 (5)
          • LLM (31)
          • Agent (4)
        • DevOps와 Infra (62)
          • DevOps 일반 (22)
          • Docker Container (3)
          • Linux (2)
          • AWS EKS (16)
          • AWS (4)
          • Kubernetes On Premise (13)
          • Security (1)
          • IDC 서버 (1)
        • 검색엔진 (8)
          • Elasticsearch (5)
          • Opensearch (3)
        • 빅데이터 (31)
          • Mongo DB (4)
          • Apache Nifi (21)
          • Scala (4)
          • Apache Spark (2)
        • 네트워크 (1)
          • SSL (1)
        • Quality Assurance (3)
          • E2E Test (3)
        • Backend(Framework) (41)
          • Java (1)
          • Spring (1)
          • Spring Boot Batch (3)
          • NestJS (9)
          • NestJS 개요(공식문서 번역) (20)
          • Cache (3)
          • Rust (4)
          • Go (0)
        • Frontend (Next.js Tailwind .. (52)
          • Frameworks (6)
          • Next.js (30)
          • Typescript (1)
          • Tailwind CSS (9)
          • React.js (4)
        • Next.js 개발 가이드 (42)
          • 01. Set up (7)
          • 02. 코딩 가이드 및 필수 패키지 (9)
          • 03. 퍼블 가이드 (3)
          • 04. Data fetching (2)
          • 05. State management (3)
          • 06. Learn Next.js 공식 가이드 (18)
        • Nuxt 공식문서 번역 (96)
          • 개요 (15)
          • Directories (23)
          • Components (12)
          • Composables (21)
          • Utils (25)
        • Nuxt 개발 가이드 (13)
          • 01. Set up (9)
          • 02. 코딩 가이드 및 필수 패키지 (0)
          • 03. 퍼블 가이드 (0)
          • 04. Data fetching (3)
          • 05. State management (1)
        • Tech 공유 세미나 - 2차 (13)
        • 기타 (13)
          • IT기타 (6)
          • story (5)
          • 문정역 여기어때 (1)
    Tech 공유 세미나 - 2차

    3장. 검색 속도 비교와 형태소 분석

    형태소분석이란? 형태소란 언어의 최소 의미 단위를 말하며, 형태소 분석이란 형태소보다 큰 언어 단위인 어절, 문장을 최소 의미인 형태소로 분절하는 것이다. Mecab Mecab-ko는 오픈소스 한글 형태소 분석기로, Mecab 이라고 하는 일본어 형태소 분석기를 차용하여 한글 특성을 반영한 분석기이다. 많은 형태소 분석기 중 직접 테스트를 해보았을때 형태소 분석 및 시간이 가장 효율적이어서 Mecab을 사용하였다. RDB vs Elasticsearch 속도 비교 case 1 : 데이터 10만건 데이터에서 10000건 단순 조회 case 2 : 데이터 10만건 데이터에서 조건문 1개 조회 case 3 : 데이터 10만건 데이터에서 조건문 3개 조회

    2023. 11. 21. 18:25 / Tech박조롱
    Tech 공유 세미나 - 2차

    2장. 필드 타입 및 조회 방법

    Mapping이란? Mapping은 필드가 저장되고 인덱싱되는 방식을 정의하는 프로세스다. Elasticsearch는 명시적으로 필드를 정의하지 않아도 데이터 유형에 따라 데이터 타입에 대한 매핑 정보가 자동으로 생성된다. 하지만, 자신이 원하지 않는 타입으로 지정될 경우 수정이 불가능하므로 상황에 따라 필드에 미리 매핑정보를 정의해야 하는 경우가 있다. Field Data Type Field Type 설명 Text keyword 입력된 문자열을 하나의 토큰으로 저장한다. 검색 시 필터링, 정렬, 집계 시 많이 사용하며, 별도의 분석기를 거치지 않기 때문에 키워드 등 정확한 검색을 할때 유용 text 입련된 문자열을 쪼개어 역색인 구조로 만든다. Numeric long 64비트 정수 integer 32비..

    2023. 11. 21. 11:15 / Tech박조롱
    Tech 공유 세미나 - 2차

    1장. Elasticsearch의 특징 및 알고리즘

    Elasticsearch란? 검색엔진의 시초인 루씬 (Lucene)을 기반으로 하고 있으며, 비정형 데이터를 색인하고 검색하는 것이 가능하며, 장점 중 하나인 역색인 구조를 사용하므로써 빠른 검색이 가능하다. Elasticsearch 기본 용어 용어 설명 Index 관계형 데이터베이스에서 table과 같이 데이터를 저장하는 공간 Shard 관계형 데이터베이스의 파티션과 같이 인덱스 내부에 색인된 데이터는 여러개의 파티션으로 구성 Document 관계형 데이터베이스의 row와 같이 데이터가 저장되는 최소 단위( JSON 포맷으로 저장) Field 관계형 데이터베이스의 Column과 같이 문서를 구성하기 위한 속성 Mapping 문서의 필드, 필드 속성을 정의하고 색인 방법을 정의 Elasticsearch의..

    2023. 11. 20. 17:22 / Tech박조롱
    Tech 공유 세미나 - 2차

    3장 플래티어의 구독형 DataLake 구축과 데이터 수집 전략

    목차 DataLake의 개념 설명과 사례 Apache NiFi를 활용한 데이터 수집 전략 Apache NiFi를 활용한 플래티어의 구독형 DataLake 생태계 구축 DataLake 데이터 레이크(Data Lake)는 다양한 종류의 비정형, 반정형, 정형 데이터를 저장할 수 있는 시스템을 말하며, 빅 데이터를 보관하고 분석하는 데 사용됩니다. 기업은 데이터 레이크를 사용함으로써 비용과 복잡성을 줄이고 유연한 분석 및 데이터 활용이 가능해집니다. 데이터 레이크 종류 Amazon Lake Fomation (클라우드 기반 데이터 레이크) Apach Hadoop (오픈 소스 데이터 레이크 엔진) HDFS, Hadoop Distributed File System (온-프레미스 데이터 레이크 파일시스템) 데이터 레..

    2023. 11. 20. 16:35 / Tech정또해방
    Tech 공유 세미나 - 2차

    2장 Apache NiFi 활용 사례와 데모

    목차 Apache NiFi의 활용 사례 소개 데모 Flow를 소개 Apache NiFi 활용 사례 소개 나이파이를 실제 활용 사례를 소개합니다. 데이터베이스 간 데이터 이전부터 데이터 레이크 구축 그리고 나이파이가 어떻게 데이터 통합 시나리오에서 활용되는지 살펴보겠습니다. 데이터베이스 간 이전 DB to DB 데이터베이스 간 이전으로 실제 사례 및 효과를 살펴보겠습니다. 플랫폼 마이그레이션 (아래의 Flow) - 기존 플랫폼에서 새로운 플랫폼으로의 마이그레이션 및 동기화 서비스 업데이트 - 새로운 서비르소 업데이트할 때 데이터 이전은 중요한 요소 - 기존 데이터베이스에 새로운 스키마를 적용하거나 새로운 데이터베이스에 데이터를 이전 함으로 업그레이드 데이터 중심 어플리케이션 이전 - 예를 들어 CRM(고객..

    2023. 11. 20. 16:14 / Tech정또해방
    Tech 공유 세미나 - 2차

    1장 Apache NiFi 소개

    목차 Apache NiFi란 무엇입니까? Apache NiFi의 기대 성능과 기능의 개요 Apache NiFi란 무엇입니까? 본론에 앞서, 아파치 재단은 설립 이후 다수의 중요한 오픈소스 프로젝트를 주도해 오면서, 빅데이터 분야에 다양한 부분에 이바지하고 있습니다. 그 분야는 하둡, 톰캣, 제로니모 등을 시작으로 그루비, 스파크, 톰캣, 플렉스 등 많습니다. 그 중 Nifi는 시스템 간 데이터 흐름을 자동화하기 위해 구축되었습니다. '데이터 흐름'이라는 용어는 다양한 맥락에서 사용되지만, 여기서는 시스템 간 정보를 자동화하고 관리하는 것을 의미합니다. 조금 더 실용성 있게 접근한다면, 기업이 연관성 있는 둘 이상의 시스템을 가지고 있을 때 '데이터 흐름'이 존재한다고 볼 수 있습니다. 여기서 어떤 시스템..

    2023. 11. 20. 11:00 / Tech정또해방
    • «
    • 1
    • ···
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • ···
    • 79
    • »

    전체 방문자

    오늘
    어제
    전체

    테크팀 개인 블로그

    정지민
    jeong
    손성준
    son
    김해수
    sunwater
    이다운
    koala
    김백엔드
    backendkim
    채희철
    bburongE

    전체 카테고리

    • 분류 전체보기 (470)
      • Ai Word 사전 (0)
      • A.I.(인공지능) & M.L.(머신러닝) (94)
        • Development Environments (9)
        • A.I. Information (14)
        • Python (6)
        • transformers (13)
        • 머신러닝 (1)
        • 딥러닝 (4)
        • 신경망 이론 (5)
        • LLM (31)
        • Agent (4)
      • DevOps와 Infra (62)
        • DevOps 일반 (22)
        • Docker Container (3)
        • Linux (2)
        • AWS EKS (16)
        • AWS (4)
        • Kubernetes On Premise (13)
        • Security (1)
        • IDC 서버 (1)
      • 검색엔진 (8)
        • Elasticsearch (5)
        • Opensearch (3)
      • 빅데이터 (31)
        • Mongo DB (4)
        • Apache Nifi (21)
        • Scala (4)
        • Apache Spark (2)
      • 네트워크 (1)
        • SSL (1)
      • Quality Assurance (3)
        • E2E Test (3)
      • Backend(Framework) (41)
        • Java (1)
        • Spring (1)
        • Spring Boot Batch (3)
        • NestJS (9)
        • NestJS 개요(공식문서 번역) (20)
        • Cache (3)
        • Rust (4)
        • Go (0)
      • Frontend (Next.js Tailwind .. (52)
        • Frameworks (6)
        • Next.js (30)
        • Typescript (1)
        • Tailwind CSS (9)
        • React.js (4)
      • Next.js 개발 가이드 (42)
        • 01. Set up (7)
        • 02. 코딩 가이드 및 필수 패키지 (9)
        • 03. 퍼블 가이드 (3)
        • 04. Data fetching (2)
        • 05. State management (3)
        • 06. Learn Next.js 공식 가이드 (18)
      • Nuxt 공식문서 번역 (96)
        • 개요 (15)
        • Directories (23)
        • Components (12)
        • Composables (21)
        • Utils (25)
      • Nuxt 개발 가이드 (13)
        • 01. Set up (9)
        • 02. 코딩 가이드 및 필수 패키지 (0)
        • 03. 퍼블 가이드 (0)
        • 04. Data fetching (3)
        • 05. State management (1)
      • Tech 공유 세미나 - 2차 (13)
      • 기타 (13)
        • IT기타 (6)
        • story (5)
        • 문정역 여기어때 (1)

    블로그 인기글

    태그

    • #아파치
    • #ElasticSearch
    • #Langchain
    • #Lora
    • #python
    • #apach
    • #나이파이
    • #Spring Boot Batch
    • #LLM
    • #adapter_model.bin
    • #finetuning
    • #셀레니움
    • #검색엔진
    • #rag
    • #React
    • #HuggingFace
    • #pyTorch
    • #문제해결
    • #AWS EKS
    • #venv
    • #딥러닝
    • #deepseek
    • #nextjs
    • #Ai
    • #파이썬
    • #fine-tuning
    • #이벤트리스너
    • #nifi
    • #langgraph
    • #GPU
    MORE
    Powered by Privatenote Copyright © 플래티어 연구소 테크 블로그 All rights reserved. TistoryWhaleSkin3.4

    티스토리툴바