[EN/한] Inference, Privacy, and the Question of Human Agency
- Jiwon Chung
- Mar 7
- 5 min read
Updated: Mar 8
![[2025] Taipei, Taiwan](https://static.wixstatic.com/media/d5bb30_acf1f5d1ff5c421588a8b0a7cf1a79d3~mv2.jpg/v1/fill/w_980,h_505,al_c,q_85,usm_0.66_1.00_0.01,enc_avif,quality_auto/d5bb30_acf1f5d1ff5c421588a8b0a7cf1a79d3~mv2.jpg)
One assumption often appears in discussions about privacy: once systems comply with formal requirements, the privacy problem is largely solved. Yet the persistence of new questions suggests otherwise. If privacy were only a matter of compliance, technological change would not keep reopening the conversation.
Recently, I have been trying to develop a small habit when thinking about research problems. Whenever a topic comes to mind, I try to frame it through a few basic questions: What exactly is the problem? Why does it matter? How might it be studied? And what kind of understanding might emerge after several years of inquiry?
Research questions rarely appear in their final form. They evolve as we read more literature, talk with others, and begin empirical work. Some ideas disappear quickly, while others remain persistent. For that reason, what follows is less a finished argument than a reflection on a question that has recently been occupying my mind.
Lately, I have come to think that the central question of privacy might be gradually shifting.
Traditionally, privacy research has focused on data leakage—preventing personal information from being exposed or misused. This concern remains important. Yet in today’s technological environment, another issue seems increasingly relevant: how much can be inferred about a person from data that has already been collected.
Our everyday environments are now deeply sensor-rich. Smartphones record mobility and location patterns. Wearable devices track heart rate and sleep cycles. Vehicles collect behavioral information about how people drive. Buildings themselves increasingly monitor movement through environmental sensors.
Individually, each dataset may appear relatively harmless. However, when aggregated and analyzed, these signals can reveal detailed insights about individuals—their routines, habits, health conditions, and sometimes even aspects of their personality.
The literature already reflects part of this shift. Several studies have demonstrated that wearable sensor data can identify individuals through gait patterns or physiological signals. Other work explores how genetic markers—such as TAS2R taste receptor genes—can be used to infer dietary patterns, alcohol sensitivity, or health risks. These studies highlight the growing power of machine learning and data-driven inference.
At the same time, an important gap seems to remain.
Much of the research has stayed within areas such as recommender systems or behavioral prediction. These contributions are valuable. However, the next step—understanding how such inferences begin to shape everyday life—appears far less studied.
Demonstrating what can be inferred from data is one thing.
Understanding how those inferences influence real-world experiences is another.
Addressing this issue likely requires methodological diversity.
Experimental approaches such as A/B testing can examine how different privacy interfaces or consent mechanisms influence user behavior. For example, simplified privacy notices or contextual permission prompts may lead users to make different decisions about sharing their data.
At the same time, qualitative methods remain essential. Interviews, diary studies, and observational research can illuminate how individuals actually interpret privacy in their daily lives.
Together, these approaches allow researchers to move beyond technical demonstrations and toward understanding privacy as a lived social phenomenon.
I do have more detailed methodological ideas in mind. However, since this is a public blog, I will leave those details aside for now.
Ultimately, this discussion connects to a broader issue: the protection of human agency. As technologies become increasingly capable of inferring personal characteristics, preserving individuals’ ability to define themselves and make autonomous choices becomes even more important.
At that point, a small contrast becomes clear.
When someone clicks “I agree,”
the administrative process may end.
Policies have been acknowledged.
Compliance has been achieved.
But for a researcher interested in how technology shapes human life,
that moment marks something different.
It marks the point where the real questions begin.
Because understanding privacy is not only about what data is collected.
It is also about what can be inferred from that data—and how those inferences begin to shape everyday life.
And those questions rarely end with a checkbox.
--
프라이버시 논의에서는 종종 하나의 전제가 등장합니다. 제도적 요구사항을 충족하면 프라이버시 문제도 대부분 해결된 것처럼 보인다는 전제입니다. 그러나 새로운 기술이 등장할 때마다 프라이버시에 대한 질문이 다시 등장하는 것을 보면, 문제는 그렇게 단순하지 않은 것 같습니다.
최근 저는 연구 문제를 생각할 때 하나의 작은 습관을 들이려고 노력하고 있습니다. 어떤 주제가 떠오르면 문제가 무엇인지, 왜 중요한지, 어떻게 탐구할 수 있는지, 그리고 몇 년의 연구 끝에 어떤 이해에 도달할 수 있을지를 스스로에게 묻는 것입니다.
물론 연구 질문은 처음부터 완성된 형태로 존재하지 않는다고 생각합니다. 새로운 문헌을 읽고, 사람들과 대화를 나누고, 실제 데이터를 다루기 시작하면서 문제의 모습은 자연스럽게 바뀌기 마련입니다. 어떤 아이디어는 금방 사라지기도 하고, 어떤 질문은 생각보다 오래 남기도 합니다. 그래서 지금 적어보는 생각들도 완성된 주장이라기보다는 최근 제 머릿속에 머물고 있는 질문의 현재 모습에 가깝습니다.
최근 저는 프라이버시 문제의 중심 질문이 조금씩 이동하고 있다고 느끼고 있습니다.
전통적으로 프라이버시 연구는 데이터 유출(data leakage) 문제에 초점을 맞추어 왔습니다. 개인 정보가 외부로 노출되거나 잘못 사용되는 상황을 방지하는 것이 핵심 관심사였습니다. 이러한 문제는 지금도 여전히 중요합니다. 그러나 오늘날의 기술 환경에서는 또 다른 질문이 점점 중요해지고 있다고 생각합니다. 바로 이미 수집된 데이터로부터 개인에 대해 얼마나 많은 것을 추론할 수 있는가라는 문제입니다.
오늘날 우리의 환경은 점점 더 센서 기반 환경으로 변화하고 있습니다. 스마트폰은 이동과 위치 패턴을 기록하고, 웨어러블 기기는 심박수와 수면 데이터를 수집합니다. 차량은 운전 행동 데이터를 축적하고, 건물 환경 센서는 사람들의 이동을 감지합니다.
각각의 데이터만 따로 보면 크게 민감하지 않아 보일 수도 있습니다. 그러나 이러한 데이터들이 결합되고 분석되는 순간 개인의 생활 패턴, 습관, 건강 상태, 심지어 성향까지도 상당히 구체적으로 드러날 수 있습니다.
기존 문헌에서도 이러한 흐름을 확인할 수 있습니다. 여러 연구에서는 웨어러블 센서 데이터를 통해 보행 패턴이나 생체 신호를 분석하여 개인을 식별할 수 있음을 보여주었습니다. 또 다른 연구에서는 TAS2R 미각 수용체 유전자와 같은 유전적 지표를 활용해 식습관이나 음주 민감도, 건강 위험 등을 추정하려는 시도도 이루어지고 있습니다.
하지만 저는 여기에서 한 가지 질문이 더 필요하다고 생각합니다.
지금까지의 많은 연구는 추천 시스템이나 행동 예측과 같은 영역에 주로 머물러 있었다고 생각합니다. 물론 이러한 연구들은 중요한 통찰을 제공해 왔습니다. 그러나 그 다음 단계—즉 이러한 추론이 실제 우리의 삶에 어떤 영향을 미치는지—에 대해서는 아직 충분히 탐구되지 않았다고 느낍니다.
데이터로 무엇을 추론할 수 있는지를 보여주는 것과
그 추론이 실제 사회에서 어떻게 작동하는지를 이해하는 것은
서로 다른 문제라고 생각합니다.
이 문제를 이해하기 위해서는 다양한 방법론이 필요합니다.
예를 들어 A/B 테스트와 같은 실험적 접근을 통해 서로 다른 프라이버시 인터페이스나 동의 구조가 사용자 행동에 어떤 영향을 미치는지 살펴볼 수 있습니다. 동시에 인터뷰, 일지 연구, 관찰 연구와 같은 질적 연구 방법을 통해 사람들이 실제 생활 속에서 프라이버시를 어떻게 이해하고 경험하는지를 탐구할 수도 있습니다.
이러한 접근이 함께 이루어질 때 우리는 단순히 기술적으로 무엇이 가능한지를 보여주는 데서 나아가, 사람들이 이러한 시스템을 실제로 어떻게 경험하고 해석하는지를 더 깊이 이해할 수 있을 것이라고 생각합니다.
물론 더 구체적인 방법론적 구상도 가지고 있습니다. 다만 이 글은 공개적인 블로그 글인 만큼, 그 부분은 이 정도에서 멈추는 것이 적절하다고 생각합니다.
결국 이 논의는 더 큰 질문으로 이어집니다.
인간의 agency, 즉 개인의 자기 결정권을 어떻게 지킬 것인가라는 문제입니다.
여기서 하나의 대비가 분명해집니다.
누군가가 “동의합니다” 버튼을 누르는 순간
행정적인 절차는 끝났을지도 모릅니다.
정책은 확인되었고
형식적인 요구사항도 충족되었습니다.
하지만 기술이 인간의 삶을 어떻게 바꾸는지를 이해하려는 연구자에게는
그 순간이 조금 다르게 보입니다.
바로 그 지점에서
진짜 질문이 시작되기 때문입니다.
프라이버시를 이해한다는 것은
단순히 어떤 데이터가 수집되는지를 보는 일이 아니라
그 데이터로부터 무엇이 추론되고, 그 추론이 우리의 삶에 어떤 영향을 미치는지를 살펴보는 일이기도 하기 때문입니다.
그리고 그런 질문은
대개 하나의 체크박스에서 끝나지 않습니다.
![[EN/한] The Origins of My Thoughts on Privacy](https://static.wixstatic.com/media/d5bb30_67cc6e05a51c48299c5c5a6b75bfdb39~mv2.jpg/v1/fill/w_980,h_735,al_c,q_85,usm_0.66_1.00_0.01,enc_avif,quality_auto/d5bb30_67cc6e05a51c48299c5c5a6b75bfdb39~mv2.jpg)
![[EN/한] Chewing on the Meaning of Truth](https://static.wixstatic.com/media/d5bb30_b1112c97f4464a6e958f0d08a7771050~mv2.webp/v1/fill/w_980,h_735,al_c,q_85,usm_0.66_1.00_0.01,enc_avif,quality_auto/d5bb30_b1112c97f4464a6e958f0d08a7771050~mv2.webp)
![[EN/한] Still Finding the Clothes That Fit Me](https://static.wixstatic.com/media/d5bb30_cef642b1b1f94673aa42dcf1cf8c1c2b~mv2.webp/v1/fill/w_980,h_735,al_c,q_85,usm_0.66_1.00_0.01,enc_avif,quality_auto/d5bb30_cef642b1b1f94673aa42dcf1cf8c1c2b~mv2.webp)