LOGIN TO YOUR ACCOUNT

Username
Password
Remember Me
Or use your Academic/Social account:

CREATE AN ACCOUNT

Or use your Academic/Social account:

Congratulations!

You have just completed your registration at OpenAire.

Before you can login to the site, you will need to activate your account. An e-mail will be sent to you with the proper instructions.

Important!

Please note that this site is currently undergoing Beta testing.
Any new content you create is not guaranteed to be present to the final version of the site upon release.

Thank you for your patience,
OpenAire Dev Team.

Close This Message

CREATE AN ACCOUNT

Name:
Username:
Password:
Verify Password:
E-mail:
Verify E-mail:
*All Fields Are Required.
Please Verify You Are Human:
fbtwitterlinkedinvimeoflicker grey 14rssslideshare1
Schnell, Rainer; Gramlich, Tobias; Bachteler, Tobias; Reiher, Jörg; Trappmann, Mark; Smid, Menno; Becher, Inna (2013)
Publisher: DEU
Types: Article
Subjects: development of methods, Zufallsauswahl, HM, Automatisierung, empirical, Klassifikation, Bayes-Klassifikation; n-Gramm; seltene Populationen; Onomastik, Methods and Techniques of Data Collection and Data Analysis, Statistical Methods, Computer Methods, Methodenentwicklung, automation, migrant, random sample, Sozialwissenschaften, Soziologie, empirisch-quantitativ, procedure, classification, sample, quantitative empirical, Verfahren, Grundlagenforschung, Bayes-Statistik, Erhebungstechniken und Analysetechniken der Sozialwissenschaften, Bayesian statistics, Social sciences, sociology, anthropology, basic research, empirisch, Stichprobe
"Zu den besten Verfahren für die Konstruktion von Migrantenstichproben gehören namensbasierte Stichproben. Hierfür werden bislang entweder ad-hoc-Listen oder namenskundliche Lexika für die Klassifikation von Namen verwendet. In diesem Beitrag wird ein neues Verfahren vorgeschlagen, das auf der automatischen Klassifikation eines Namens anhand der n-Gramme des Namens und der Anwendung des Bayes-Theorems basiert. Das neue Verfahren ist fehlertolerant gegenüber alternativen Schreibweisen und erlaubt auch die Klassifikation von Namen, die sich nicht in den Lexika finden. Das Verfahren wurde anhand der Namen der ca. 1.600 Ausländer im PASS-Panel und einer CATI-Studie in Hessen untersucht." (Autorenreferat) "The set of best methods for sampling migrant populations includes name-based sampling. So far this is done using either ad-hoc lists or onomastic dictionaries for the classification of names. This paper proposes a new name-based procedure, which uses a Bayes-classifier for the n-grams of the name. The new procedure is fault-tolerant of alternate spellings, and also allows the classification of names that are not found in dictionaries. It was tested using the names of about 1.600 foreigners in the PASS panel. Finally, a CATI survey based on the new method in Hesse is described." (author's abstract)
  • The results below are discovered through our pilot algorithms. Let us know how we are doing!

    • 16 Hierzu gehören in diesem Datensatz Estland, Lettland, Litauen, Sowjetunion, Russische Föderation, Ukraine, Weißrussland, Armenien, Aserbaidschan, Kasachstan, Kirgisistan, Tadschikistan und Turkmenistan.
    • 17 Hierzu gehören Bosnien und Herzegowina, Jugoslawien, Kroatien, Makedonien, Albanien und Slowenien. Die ehemalige Bundesrepublik Jugoslawien war zum Zeitpunkt der Erstellung der Namensliste noch nicht in Serbien und Montenegro zerfallen.
    • 18 Hierzu gehören Polen, Bulgarien, Ungarn, Rumänien, ehemalige Tschechoslowakei, Slowakei und die Tschechische Republik.
    • 19 Diese Beschränkung resultiert allein aus der Größe der Subgruppen im Validierungsdatensatz. In anderen Anwendungen kann eine andere - oder auch gar keine - Zusammenfassung der in den Trainingsdaten erfassten Länder zu Gruppen gewählt werden.
    • 20 Da das Verfahren unter anderem für kommerzielle Zwecke (z. B. durch Adresshändler) verwendet werden kann, hat sich die Arbeitsgruppe entschlossen, weder die Trainingsdaten noch die Klassifikationsergebnisse öffentlich zur Verfügung zu stellen.
    • Bertelsmann Stiftung (Hg.), 2009: Zuwanderer in Deutschland. Ergebnisse einer repräsentativen Befragung von Menschen mit Migrationshintergrund. Gütersloh: Bertelsmann Stiftung.
    • Blane, H. D., 1977: Acculturation and Drinking in an Italian American Community. Journal of Studies on Alcohol 38 (7): 1324-1346.
    • Brettfeld, K. und P. Wetzels, 2007: Muslime in Deutschland. Integration, Integrationsbarrieren, Religion sowie Einstellungen zu Demokratie, Rechtsstaat und politischreligiös motivierter Gewalt. Berlin: Bundesministerium des Innern.
    • Burkhauser, R. V., M. Kreyenfeld und G. G. Wagner, 1997: The Immigrant Sample of the German Socio Economic Panel. Aging Studies Working Paper 7, Maxwell Center for Demography and Economics of Aging, Syracus, NY.
    • Cavnar, W. B. und J. M. Trenkle, 1994: N-Gram-Based Text Categorization. S. 161-175 in: Proceedings of SDAIR-94: 3rd Annual Symposium on Document Analysis and Information Retrieval.
    • Diefenbach, H. und A. Weiß, 2006: Zur Problematik der Messung von „Migrationshintergrund“. Münchner Statistik 3: 1-14.
    • Ecob, R. und R. Williams, 1991: Sampling Asian Minorities to Asses Health and Welfare. Journal of Epidemiology and Community Health 45: 93-101.
    • European Union Agency for Fundamental Rights, 2009: EU-MIDIS Technical report: methodology, sampling and fieldwork. European Union minorities and discrimination survey. Budapest: Elanders Hungary Kft.
    • Galonska, C., M. Berger und R. Koopmans, 2004: Über schwindende Gemeinsamkeiten: Ausländer- versus Migrantenforschung. Technischer Bericht, Wissenschaftszentrum Berlin (WZB), Berlin.
    • Granato, N., 1999: Die Befragung von Arbeitsmigranten: Einwohnermeldeamt-Stichprobe und telefonische Erhebung? ZUMA-Nachrichten 45 (23): 44-60.
    • Haisken-DeNew, J. und J. R. Frick, 2005: Desktop Companion to the German Socio-Economic Panel (SOEP). Berlin: DIW Berlin.
    • Halm, D. und M. Sauer, 2005: Freiwilliges Engagement von Türkinnen und Türken in Deutschland. Projektbericht, Stiftung Zentrum für Türkeistudien an der Universität DuisburgEssen, Essen.
    • Haug, S., 2010: Interethnische Kontakte, Freundschaften, Partnerschaften und Ehen von Migranten in Deutschland. Working Paper 33, Bundesamt für Migration und Flüchtlinge, Nürnberg.
    • Haug, S. und F. Swiaczny, 2003: Migrations- und Integrationsforschung in der Praxis. Das Beispiel BiB-Integrationssurvey. Zeitschrift für Angewandte Geographie 27 (1): 16-20.
    • Humpert, A. und K. Schneiderheinze, 2000: Stichprobenziehung für telefonische Zuwandererumfragen. Einsatzmöglichkeiten der Namensforschung. ZUMA-Nachrichten 24 (47): 36-64.
    • Infas, 2009: Methodenbericht des Projekts Kriminalitätsfurcht in Hessen. infas: Bonn.
    • Jurafsky, D. und J. H. Martin, 2009: Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. New Jersey: Pearson.
    • Kalton, G., 2009: Methods for oversampling rare subpopulations in social surveys. Survey Methodology 35 (2): 125-141.
    • Kalton, G. und D. Anderson, 1986: Rare Populations. Journal of the Royal Statistical Society. Series A 149 (1): 65-82.
    • Konstantopoulos, S., 2007: What's in a Name? In: Proceedings of the Computational Phonology Workshop. 6th International Conference on Recent Advances in NLP. Bulgarien. http://arxiv.org/abs/0710.1481.
    • Lauderdale, D. S., 2006: Birth Outcomes for Arabic-Named Women in California Before and After September 11. Demography 43 (1): 185-201.
    • Lessler, J. T. und W. D. Kalsbeek, 1992: Nonsampling Errors in Surveys. New York: Wiley.
    • Mammey, U. und J. Sattig, 2002: Determinanten und Indikatoren der Integration und Segregation der ausländischen Bevölkerung (Integrationssurvey). Projekt- und Materialdokumentation. Materialien zur Bevölkerungswissenschaft des Bundesinstituts für Bevölkerungsforschung, Nr. 105a. Wiesbaden: Bundesinstitut für Bevölkerungsforschung.
    • Passel, J. S. und D. L. Word, 1993: Constructing the List of Spanish Surnames for the 1980 Census: An Application of Bayes' Theorem (Paper presented at the Annual Meeting of the Population Association of America) 1980. Technical Working Paper 4, Population Division, U.S. Bureau of the Census, Washington D.C.
    • Perkins, C. R., 1993: Evaluating the Passel-Word Spanish Surname List: 1990 Decennial Census Post Enumeration Survey Results. Technical Working Paper 4, Population Division, U.S. Bureau of the Census, Washington D.C.
    • Promberger, M. (Hg.), 2007: Neue Daten für die Sozialstaatsforschung. Zur Konzeption der IAB-Panelerhebung „Arbeitsmarkt und Soziale Sicherung“. IAB- Forschungsbericht (12). Nürnberg: Institut für Arbeitsmarkt- und Berufsforschung.
    • Rother, N., 2010: Das Integrationspanel. Ergebnisse einer Befragung von Teilnehmenden zu Beginn ihres Alphabetisierungskurses. Working Paper 29, Bundesamt für Migration und Flüchtlinge, Nürnberg.
    • Sachverständigenrat deutscher Stiftungen für Integration und Migration (SVR) (Hg.), 2010: Einwanderungsgesellschaft 2010. Jahresgutachten 2010 mit Integrationsbarometer. Berlin: Sachverständigenrat deutscher Stiftungen für Integration und Migration.
    • Salentin, K., 2007: Die Aussiedler-Stichprobenziehung. Methoden - Daten - Analysen 1 (1): 25-44.
    • Schnell, R., 2009: Wie man Nadeln in Heuhaufen findet. Stichprobenverfahren für seltene und sehr seltene Bevölkerungsgruppen, Vortragsmanuskript, Universität DuisburgEssen, Duisburg.
    • Schnell, R., 2012: Empirische Untersuchung eines CATI-Stichprobendesigns für seltene Populationen. Endbericht für das Bundesministerium für Bildung und Forschung. Technischer Bericht, Universität Duisburg-Essen, Duisburg.
    • Schnell, R., T. Gramlich und M. Trappmann, 2011: Potential Undercoverage and Bias in Name-based Samples of Foreigners. Vortrag auf der ASA Spring Methodology Conference, Mai 2011, Tilburg.
    • Schnell, R., P. B. Hill und E. Esser, 2011: Methoden der empirischen Sozialforschung, 9. Auflage, München: Oldenbourg.
    • Schnell, R., T. Gramlich, T. Bachteler, J. Reiher, M. Trappmann, M. Smid und I. Becher, 2012: Ein neues Verfahren für namensbasierte Zufallsstichproben von Migranten. Working Paper Wp-grlc-2012-02, German Record Linkage Center, Nürnberg.
    • Schwartz, K. L., A. Kulwicki, L. K. Weiss, H. Fakhouri, W. Sakr, G. Kau und R. K. Severson, 2004: Cancer among arab americans in the metropolitan Detroit area. Ethnicity & Disease 14 (1): 141-146.
    • Shackleford, M., 1998: Actuarial Note: Name Distributions in the Social Security Administration Area, August 1997. Social Security Administration Acturial Note 139, Social Security Administration. Office of the Chief Actuary, Baltimore, MA.
    • Simon, E. und G. Kloppenburg, 2007: Das Fernsehpublikum türkischer Herkunft - Fernsehnutzung, Einstellungen und Programmerwartungen. Ergebnisse einer Repräsentativbefragung in Nordrhein-Westfalen. Media-Perspektiven 3: 142-152.
    • Statistisches Bundesamt, 2011a: Bevölkerung und Erwerbstätigkeit. Bevölkerung mit Migrationshintergrund. Ergebnisse des Mikrozensus 2010. Wiesbaden: Statistisches Bundesamt.
    • Statistisches Bundesamt, 2011b: Bevölkerung und Erwerbstätigkeit. Ausländische Bevölkerung. Ergebnisse des Ausländerzentralregisters. Wiesbaden: Statistisches Bundesamt.
    • Trappmann, M., S. Gundert, C. Wenzig und D. Gebhardt, 2010: PASS: A household panel survey for research on unemployment and poverty. Schmollers Jahrbuch. Zeitschrift für Wirtschafts- und Sozialwissenschaften 130 (4): 609-622.
    • Winkler, W. E. (2009). Record linkage. S. 351-380 in: D. Pfeffermann und C. Rao (Hg.), Handbook of Statistics. Sample Surveys: Design, Methods and Applications. Bd. 29A. Amsterdam: Elsevier.
  • No related research data.
  • No similar publications.

Share - Bookmark

Cite this article