신규 아이디 추천, Python3 [프로그래머스]

문제풀이(Problem Solving)

신규 아이디 추천, Python3 [프로그래머스]

게임이 더 좋아 2021. 3. 6. 04:12

728x170

문제 설명

카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.
다음은 카카오 아이디의 규칙입니다.

아이디의 길이는 3자 이상 15자 이하여야 합니다.
아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.

"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,

1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다. 2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다. 3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다. 4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다. 5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다. 6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다. 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다. 7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.

예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.

1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
"...!@BaT#*..y.abcdefghijklm" → "...!@bat#*..y.abcdefghijklm"

2단계 '!', '@', '#', '*' 문자가 제거되었습니다.
"...!@bat#*..y.abcdefghijklm" → "...bat..y.abcdefghijklm"

3단계 '...'와 '..' 가 '.'로 바뀌었습니다.
"...bat..y.abcdefghijklm" → ".bat.y.abcdefghijklm"

4단계 아이디의 처음에 위치한 '.'가 제거되었습니다.
".bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"

5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"

6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghi"

7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
"bat.y.abcdefghi" → "bat.y.abcdefghi"

따라서 신규 유저가 입력한 new_id가 "...!@BaT#*..y.abcdefghijklm"일 때, 네오의 프로그램이 추천하는 새로운 아이디는 "bat.y.abcdefghi" 입니다.

[문제]

신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때, "네오"가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.

[제한사항]

new_id는 길이 1 이상 1,000 이하인 문자열입니다.
new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
new_id에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.

사실 정규표현식부터 생각난 것은 사실이나.. 정규표현식을 쓰려고 하니 패턴을 까먹어서 쓸 수 없었다.

1. 정규표현식을 모르는 풀이

def solution(new_id):
    #1
    id = list(new_id.lower()) # 소문자
    ans = []
    #2
    for i in id:
        if(i.isalnum() == True or i == '-' or i == '_' or i =='.'): #해당되는 문자들만 파싱
            ans.append(i)
    
    #3 + #4
    
try:
        while True: #변화가 없을 때까지 반복
            check = False
            if ans[0] == '.':
                check = True
                ans = ans[1:]
            if ans[-1] == '.':
                check = True
                ans = ans[:-1]
            for i in range(len(ans) - 1):# 이웃되는 것 조사
                if ans[i] == '.' and ans[i + 1] == '.': 
                    check = True
                    ans = ans[:i] + ans[i + 1:] #중복제거
                    break
            if not check:
                break
    except:
        pass
        
        
    #5
    if len(ans) == 0: # 문자가 존재하지 않는다면
        ans.append('a')
    #6
    if len(ans) >= 16: # 문자 길이가 15를 초과한다면
        ans = ans[:15]
        while(True): #뒷부분 다시 비교
            if(ans[-1] == '.'):
                del ans[-1]
                continue
            else:
                break
    #7
    if len(ans) < 3: #3보다 작으면 마지막문자를 3이 될 때까지 추가
        char = ans[-1]
        while(True):
            ans.append(char)
            if (len(ans)>= 3):
                break
    
    answer = ''.join(ans)
    return answer

#3+4

변화가 없을 때까지 반복이라는 것이 중요한 핵심이라고 나는 생각함

2. 정규표현식

다른 분들은 이렇게 하였더이다.

나도 이렇게 하려고 했는데..ㅠ

import re

def solution(new_id):
    st = new_id
    st = st.lower()
    st = re.sub('[^a-z0-9\-_.]', '', st)
    st = re.sub('\.+', '.', st)
    st = re.sub('^[.]|[.]$', '', st)
    st = 'a' if len(st) == 0 else st[:15]
    st = re.sub('^[.]|[.]$', '', st)
    st = st if len(st) > 2 else st + "".join([st[-1] for i in range(3-len(st))])
    return st

정규표현식은 따로 한 번 정리하겠다.

특정 문자 범위에 포함되지 않는지 판단이 필요하다.

특정 문자열로 시작하는지 판단할 때도 ^를 사용했었는데 이게 헷갈리게 만든다.

예를 들어

'[^A-Z]+'는 대문자를 제외한 모든 문자(숫자)가 1개 이상 있는지 판단하는 것이다.

범위를 제외할 때는 '[^A-Z]+'와 같이 [ ] 안에 넣어주고

특정 문자 범위로 시작할 때는 '^[A-Z]+'와 같이 [ ] 앞에 붙여서 구분한다.

그렇다면?

[^a-z0-9\-_.] ->을 제외한 모든 문자들을 의미한다.

re.sub('[^a-z0-9\-_.]', ' ' ,st)라는 것은

st에서 맨 앞의 문자를 제외한 것들을 공백으로 만들어준다는 이야기이다.

그리고 -은 메타문자이므로 \, 이스케이프코드를 이용하여 사용하는 것이다.

re.sub('\.+', ' ' , st)라는 것은

.이 1번이상 반복된 부분을 .으로 교체하겠다는 의미다.

re.sub('^[.][.]$', ' ', st)라는 것은

.으로 시작하거나 .으로 끝나는 부분을 공백으로 교체하겠다는 의미다.

**여기서 특정문자 시작하는 것과 포함하는 것의 차이점이 드러난다.

728x90

그리드형

저작자표시 비영리 변경금지 (새창열림)

'문제풀이(Problem Solving)' 카테고리의 다른 글

체육복, Python3 [프로그래머스] (0)	2021.03.07
모의고사, Python3 [프로그래머스] (0)	2021.03.06
완주하지 못한 선수, Python3 [프로그래머스] (0)	2021.03.05
두 개 뽑아서 더하기, Python3 [프로그래머스] (0)	2021.03.05
크레인 인형뽑기 게임, Python3 [프로그래머스] (0)	2021.03.05

현재글신규 아이디 추천, Python3 [프로그래머스]

노는 게 제일 좋아