문제풀이(Problem Solving)

신규 아이디 추천, Python3 [프로그래머스]

게임이 더 좋아 2021. 3. 6. 04:12
반응형
728x170

 

문제 설명

카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.
다음은 카카오 아이디의 규칙입니다.

  • 아이디의 길이는 3자 이상 15자 이하여야 합니다.

  • 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.

  • 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.

"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,

1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다. 2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다. 3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다. 4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다. 5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다. 6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다. 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다. 7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.


예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.

1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
"...!@BaT#*..y.abcdefghijklm" → "...!@bat#*..y.abcdefghijklm"

2단계 '!', '@', '#', '*' 문자가 제거되었습니다.
"...!@bat#*..y.abcdefghijklm" → "...bat..y.abcdefghijklm"

3단계 '...'와 '..' 가 '.'로 바뀌었습니다.
"...bat..y.abcdefghijklm" → ".bat.y.abcdefghijklm"

4단계 아이디의 처음에 위치한 '.'가 제거되었습니다.
".bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"

5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"

6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghi"

7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
"bat.y.abcdefghi" → "bat.y.abcdefghi"

따라서 신규 유저가 입력한 new_id가 "...!@BaT#*..y.abcdefghijklm"일 때, 네오의 프로그램이 추천하는 새로운 아이디는 "bat.y.abcdefghi" 입니다.


[문제]

신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때, "네오"가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.

[제한사항]

new_id는 길이 1 이상 1,000 이하인 문자열입니다.
new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
new_id에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.

 

 

사실 정규표현식부터 생각난 것은 사실이나.. 정규표현식을 쓰려고 하니 패턴을 까먹어서 쓸 수 없었다.

 

1. 정규표현식을 모르는 풀이

def solution(new_id):
    #1
    id = list(new_id.lower()) # 소문자
    ans = []
    #2
    for i in id:
        if(i.isalnum() == True or i == '-' or i == '_' or i =='.'): #해당되는 문자들만 파싱
            ans.append(i)
    
    #3 + #4
    
try:
        while True: #변화가 없을 때까지 반복
            check = False
            if ans[0] == '.':
                check = True
                ans = ans[1:]
            if ans[-1] == '.':
                check = True
                ans = ans[:-1]
            for i in range(len(ans) - 1):# 이웃되는 것 조사
                if ans[i] == '.' and ans[i + 1] == '.': 
                    check = True
                    ans = ans[:i] + ans[i + 1:] #중복제거
                    break
            if not check:
                break
    except:
        pass
        
        
    #5
    if len(ans) == 0: # 문자가 존재하지 않는다면
        ans.append('a')
    #6
    if len(ans) >= 16: # 문자 길이가 15를 초과한다면
        ans = ans[:15]
        while(True): #뒷부분 다시 비교
            if(ans[-1] == '.'):
                del ans[-1]
                continue
            else:
                break
    #7
    if len(ans) < 3: #3보다 작으면 마지막문자를 3이 될 때까지 추가
        char = ans[-1]
        while(True):
            ans.append(char)
            if (len(ans)>= 3):
                break
    
    answer = ''.join(ans)
    return answer

#3+4

변화가 없을 때까지 반복이라는 것이 중요한 핵심이라고 나는 생각함

 

 

2. 정규표현식

다른 분들은 이렇게 하였더이다.

나도 이렇게 하려고 했는데..ㅠ

import re

def solution(new_id):
    st = new_id
    st = st.lower()
    st = re.sub('[^a-z0-9\-_.]', '', st)
    st = re.sub('\.+', '.', st)
    st = re.sub('^[.]|[.]$', '', st)
    st = 'a' if len(st) == 0 else st[:15]
    st = re.sub('^[.]|[.]$', '', st)
    st = st if len(st) > 2 else st + "".join([st[-1] for i in range(3-len(st))])
    return st

 

정규표현식은 따로 한 번 정리하겠다.

특정 문자 범위에 포함되지 않는지 판단이 필요하다.

특정 문자열로 시작하는지 판단할 때도 ^를 사용했었는데 이게 헷갈리게 만든다.

 

예를 들어

'[^A-Z]+'는 대문자를 제외한 모든 문자(숫자)가 1개 이상 있는지 판단하는 것이다.

범위를 제외할 때는 '[^A-Z]+'와 같이 [ ] 안에 넣어주고

특정 문자 범위로 시작할 때는 '^[A-Z]+'와 같이 [ ] 앞에 붙여서 구분한다.

 

그렇다면?

[^a-z0-9\-_.] ->을 제외한 모든 문자들을 의미한다.

re.sub('[^a-z0-9\-_.]', ' ' ,st)라는 것은

st에서 맨 앞의 문자를 제외한 것들을 공백으로 만들어준다는 이야기이다.

 

그리고 -은 메타문자이므로 \, 이스케이프코드를 이용하여 사용하는 것이다.

 

re.sub('\.+', ' ' , st)라는 것은

.이 1번이상 반복된 부분을 .으로 교체하겠다는 의미다.

 

re.sub('^[.][.]$', ' ', st)라는 것은

.으로 시작하거나 .으로 끝나는 부분을 공백으로 교체하겠다는 의미다.

**여기서 특정문자 시작하는 것과 포함하는 것의 차이점이 드러난다.

 

 

728x90
반응형
그리드형