안녕하세요.
GPT Prompt Tester입니다.
이번 v1.0.2 업데이트에서는 GPT Playground의 패널 비교 기능이 새롭게 추가되었습니다.
이제 여러 패널을 나란히 두는 것에서 끝나지 않고,
프롬프트, 변수, 모델/옵션, 결과, 핵심 지표 차이까지 한 화면에서 직접 비교할 수 있습니다.
또한 이번 버전에서는 Writing Studio의 제목 추천 및 초안 작성 품질을 다듬고,
Eval 결과 확인 및 PDF 저장 흐름, OpenAI 사용량 계산 정확도도 함께 개선했습니다.
이번 업데이트의 핵심
- GPT Playground 패널 비교 기능 추가
- Writing Studio 제목 추천/초안 작성 품질 개선
- Eval 결과 확인 및 PDF 저장 흐름 개선
- OpenAI 사용량 계산 보정
1. 패널 비교 보기 기능 추가
이번 버전의 가장 큰 변화는 비교 보기(Compare View) 기능입니다.
기존에는 여러 패널을 나란히 두고 각각 실행 결과를 확인할 수는 있었지만,
실제로 무엇이 어떻게 달라졌는지는 사용자가 직접 읽고 판단해야 했습니다.
이제는 비교할 패널을 선택하면 상단 비교 영역에서 다음 내용을 한 번에 확인할 수 있습니다.
- 어떤 항목이 달라졌는지 요약
- 모델/옵션 차이
- 변수 차이
- 프롬프트 차이
- 결과 차이
- 응답 시간, 토큰, 비용 등 핵심 지표 비교
또한 선택한 패널은 Baseline과 Compare 역할로 정리되어,
어느 쪽을 기준으로 보고 있는지도 훨씬 명확해졌습니다.
비교 기능 추가 관련 패널 변경 사항
비교 기능이 추가되면서 패널의 타이틀 바(①)가 추가되었습니다.

패널이 2개 이상으로 비교 가능한 상태가 되면 비교 버튼(②)이 표시됩니다.
템플릿 불러오기(③), 템플릿으로 저장하기(④), 새 패널 생성/복제(⑤) 버튼의 UI도 더 분명하게 정리했습니다.
비교 버튼(②)을 클릭하면 패널 상단에 비교 보기 화면이 표시됩니다.
처음 비교에 추가한 패널의 실행 내용이 기준인 Baseline이 됩니다.

이 상태에서 화면 분할 바를 드래그해 상하 분할 영역의 크기를 조절할 수 있습니다.
이후 두 번째 패널의 비교 버튼을 클릭하면 ‘Compare‘ 패널이 추가되며, 두 패널의 프롬프트 실행 결과를 더 쉽게 비교할 수 있습니다.

또한 프롬프트의 어느 부분이 달라졌는지도 화면에서 바로 확인할 수 있습니다.

이제 멀티 패널은 단순히 여러 개를 띄워두는 기능이 아니라,
프롬프트 실험 결과를 실제로 읽고 판단하는 비교 작업 공간에 더 가까워졌습니다.
2. Writing Studio 품질 개선
Writing Studio도 결과 품질과 안정성 중심으로 정비했습니다.
제목 추천 개선
- 더 짧고 자연스러운 블로그 제목 중심으로 추천되도록 조정
- 한 제목에 메시지가 과하게 들어가 장문처럼 보이던 문제 완화
초안 작성 개선
- HTML 출력 규칙을 더 엄격하게 정리
- WordPress 업로드 시 블록 변환 안정성 일부 개선
- 기타 안정성 개선
기본 모델 변경
- 글작성 기본 모델을
gpt-5.4-mini로 조정했습니다.
3. Eval 기능 개선
Eval은 결과를 확인하고 저장하는 흐름 쪽을 다듬었습니다.
PDF 저장 항목 선택 개선
히스토리에서 바로 Response Quality 탭으로 들어온 경우에도,
현재 열린 탭이 아니라 실제로 존재하는 Eval 데이터 기준으로 PDF 포함 항목이 표시되도록 수정했습니다.
이제 다음 항목은 실제 데이터 존재 여부에 따라 더 자연스럽게 노출됩니다.
- 사용 프롬프트
- Prompt Analysis
- Response Quality
- Improve
4. OpenAI 사용량 계산 정확도 개선
사용량 대시보드와 기록 데이터의 기본 단가 계산도 보정했습니다.
이제 호출 수는 맞지만 금액이 실제보다 크게 잡히던 문제를 줄이고,
앞으로 저장되는 사용량 기록도 더 정확한 기준으로 계산됩니다.
이번 버전에서 기대할 수 있는 변화
- 여러 패널의 차이를 더 직접적으로 읽을 수 있습니다.
- Writing Studio의 제목 추천과 초안 생성 결과가 더 자연스러워졌습니다.
- 히스토리에서 Eval을 열고 PDF로 정리하는 흐름이 더 매끄러워졌습니다.
- OpenAI 사용량 금액 계산의 신뢰도가 높아졌습니다.
한 줄 요약
v1.0.2은 GPT Playground 비교 기능을 본격 추가하고, Writing Studio / Eval / 사용량 계산 품질을 함께 다듬은 안정화 업데이트입니다.
감사합니다.



