일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 코테 문제
- 딥러닝
- 삼성역량테스트
- sort
- dfs문제
- 초소형머신러닝
- 임베디드 딥러닝
- dfs
- 컴퓨팅사고
- 영상처리
- TensorFlow Lite
- 다이나믹프로그래밍
- 삼성코테
- BFS
- 삼성코딩테스트
- 포스코 교육
- 코딩테스트
- MCU 딥러닝
- 삼성역테
- 알고리즘
- 포스코 ai 교육
- DP문제
- 그리디
- DP
- 자료구조
- bfs문제
- 포스코 AI교육
- tflite
- 코테
- tinyml
- Today
- Total
목록영상처리 (7)
코딩뚠뚠
영상 품질을 비교하는 지표들은 Super Resolution 의 결과를 측정하는데 사용되곤 한다. 들어가기에 앞서... Super Resolution 이란? "초 해상화" 로 저해상도의 이미지를 고해상도의 이미지로 변환하는 기술을 말한다 딥러닝 이전에는 Nearest Neighbor, Bilinear, Bicubic 등 보간법 (interpolation)에 의존했으며, 최근에는 여러 딥러닝 알고리즘에 의존한다. Super Resolution 을 사용하는 이유는? 고해상도의 이미지를 어딘가로 전송하려면 그만큼 많은 리소스가 필요할 것이다. 저해상도로 전송 후 사용하고자 하는 곳에서 고해상도로 변환할 수 있다면 자원을 효율적으로 이용할 수 있다. MSE 란? Mean Square Error(평균제곱오차) 로..
공간 필터링이란? 영어로는 Spatial Filtering 이라고 부른다. 영상에 쓰이는 필터는 부드럽게 만드는 필터와 날카롭게 만드는 필터가 있을 것이다. 이의 쓰임은 feature를 특징하기 위함일 수 있고 추적할 수도, 또는 기본적으로 사진을 보정하기 위함일 수도 있다. 이를 위해서는 마스크 연산을 사용한다. 공간필터링은 영상 신호에 대해 공간 영역 에서의 필터 처리(필터링) 를 의미한다. 필터링 이란? 무언가를 걸러주는 것이다. 영상에서의 필터링도 같은 맥락으로 생각하면 된다. 필터를 이용해 영상에서 필요한 정보만 통과시키는 과정을 필터링이라고 한다. 영상처리에서의 필터링은 크게 두 종류로 나눠볼 수 있다. 주파수공간에서의 필터링과 공간적필터링이다. 주파수 공간에서의 필터링 : 푸리에 변환을 통해..
영상의 산술연산: 덧셈 뺄셈 평균 차이 와 같은 연산이 있으며 이러한 연산을 통해서 새로운 영상을 만들거나 화질의 향상을 노릴 수 있다. 1. 덧셈연산 두 영상의 같은 위치에 있는 픽셀들을 더해서 새로운 영상을 만들어 내는 것이다. 영상1의 픽셀값이 100, 영상2의 픽셀값이 100 이면 새로운 영상의 픽셀값은 200으로 밝아질 것이다. 만약 255가 넘는다면 255로 값을 고정한다. ROI 덧셈연산에서 중요한 것은 mask 로 관심영역을 추출하는 것이다. 영상1이 있고 영상2는 반은 검정색(0) 반은 흰색(255) 라고 해보자. 이 둘을 합쳤을 때는 어떤 영상이 도출되게 될까? 영상2의 검정색영역에만 영상1이 남게 될것이다. 이와같이 덧셈연산으로 관심영역을 추출할 수 있다. 2. 뺄셈연산 두 영상의 같..
이전 포스팅에서 히스토그램 분석에 대해 알아봤다. 이제는 영상의 히스토그램을 파악하고 영상의 히스토그램을 전 구간에 골고루 나타나게 변환하는 방법에 대해 알아본다. 1. 히스토그램 스트레칭 영상의 히스토그램이 그레이스케일 전 구간에서 골고루 나타나도록 변경하는 선형 변환기법이다. 히스토그램을 잡아 늘여서 전 구간에 히스토그램이 나타나도록 변환한다. -> 전체적으로 포진하게 되면 명암비가 높아지게 된다. 2. 히스토그램 평활화 히스토그램 스트레칭이 선형으로 늘여줬다면 히스토그램 평활화는 히스토그램의 누적분포 특성에 의해서 변경시킨다. 이또한 명암비를 맞추기 위한 방법이다. 방법은 다음과같다. 새로운 히스토그램 값 = N[이전 히스토그램값] *255 (N : 정규화된 누적 히스토그램) - 누적 히스토그램이란..
요즘은 딥러닝으로 화질향상을 노리지만 이의 기초가 되는 것은 고전 영상처리 알고리즘에서의 화질향상 기법이다. - waifu2x 같은 사이트에서 딥러닝으로 사진의 화질을 향상시키는 서비스를 제공한다. 용도에 따라서는 밝기와 명암비를 조절하는 것도 화질을 향상시킬 수 있겠지만 감마보정에서부터 시작하려고 한다. 핵심 : 감마보정은 비선형이다. 255가 최대값이면 128은 이의 절반의 밝기를 나타내야 할 것이다. 하지만 그렇지 않다. 비선형 전달함수를 사용해서 빛의 강도를 비선형적으로 변형하기 때문이다. (감마 보정이라고 널리 쓰이나 감마 부호화라는 표현이 더 적절하다고 한다.) 목적 : 인간 시각의 비선형성에 맞춰 정보를 부호화 인간 시각은 그 어떤 카메라보다 명암차이를 매우 잘 구별하고, 색상, 해상도 차이..
영상이 표현되고 우리 눈에 인식되는 것은 평면상이기 때문에 이를 직관적으로 처리하기 위해서 2차원 배열을 사용한다. 가로 크기가 500 세로크기가 300 이면 unsigned char a[300][500] 으로 나타낼 수 있다. unsigned char a[세로][가로] = unsigned char a[행][열] 만약 unsigned 가 없다면 그냥 char은 -127 ~127 의 정수를 저장할 것이다. 따라서 unsigned를 사용한다.
영상의 표현 영상을 처리하는데 있어 영상은 그레이스케일(흑백) / 컬러 로 나타낸다. + 영상의 기본 단위는 픽셀(화소) 이다. = 그레이스케일 영상에서 하나의 픽셀은 0~255 즉 256개의 정숫값을 가진다. ( 왜냐하면 1픽셀->1byte=8bit=2^8=256 이기 때문에 256가지의 수를 표현할 수 있기때문) 0은 검정색, 255는 흰색을 나타낸다. 영상의 좌표계 기본적으로 수학을 배울때 x축과 y축을 배우고 (0,0) 은 왼쪽 맨 아래, (N,N) 으로 가면 오른쪽 위로 상승한다. 하지만 영상에서는 맨 왼쪽위에가 (0,0) 이고 오른쪽 아래로 내려가게 되면 (N,N)이 되게 된다.