Definitionen von Städten
Administrativ
Selbstklassifizierung
klare Grenzen
typisch in Analysen von Gesetzen, die mit Stadtgrenzen übereinstimmen
morphologisch
kontinuierlich verbaute Fläche
aus Satellitenbildern gebaut (Landsat, Nachtlichter)
funktional
Metropolregion, Pendlerzone
Versucht einen Arbeitsmarkt zu fangen
Aus Subeinheiten aggregiert
Administrative Grenzen sind schwer zu vergleichen:
Agglomerationstheorie
Modelle von Salopp, Hotelling
Erstaunlich komplex
Handelstheorie
Überschneidungen mit Industrieökonomie
Größe und Form
Diese Probleme sind gravierender, wenn
Es wenige Flächen gibt
Flächenform und Größe endogen sind
Es wenig Variation in den Studienobjekten gibt (wenige Firmen in einem Land)
Schachbrett Zugang löst das Problem, wenn die Daten es erlauben. Kontinuierliche Datenquellen (Licht, GRUMP) können mit Rastern gemeinsam verwendet werden.
Wünschenswerte Eigenschaften eines Agglomerationsmaßes
Vergleichbar über Industrien
Vergleichbar über die Zeit
Unabhängig von anderen Agglomerationstendenzen (Kalifornien ist größer als Montana)
Unabhängig von Industrie-interner Agglomeration (75 Prozent der Staubsauger in den USA werden in 4 Fabriken hergestellt, diese Asymmetrie ist nicht das gleiche wie Agglomeration.)
Skaleninvariant
Test für statistische Signifikanz
Berechenbar
Konsistent mit ökonomischer Theorie
Dartbrett Modell - Ellison und Glaeser (1997)
Dartbrett Modell
Problem der Heterogenität der Gröÿe von Firmen innerhalb einer Industrie?
Mathematik Ellison und Glaeser
Ellison und Glaeser Koagglomeration
Duranton und Overman 2005
EG arbeitet mit aggregierten Daten (Flächen). Daten mit größerer Auflösung erlauben genauere Maße.
Besonders für Analyse innerhalb einer Stadt wichtig.
Maß anhand von paarweiser Distanz anstatt aggregierter Punkte
Vergleich von paarweisen Distanzen von Firmen einer Industrie mit zufälligen Distanzen zwischen Firmen aller Industrien.
Duranton und Overman
Eigenschaften
Vergleichbar für verschiedene Industrien
Unabhängig von allgemeiner Konzentration (Alle Firmen sind eher in Frankfurt als Heidelberg weil Frankfurt größer ist).
Unabhängig von Industriekonzentration (Hier: mechanisch vergleichbare Kontrollgruppe)
Signifikanztest
Ellison Glaeser konsistent mit den ersten drei, aber nicht den letzten zwei Eigenschaften.
Beispiel: konzentriert
Beispiel: Nicht konzentriert
Beispiel: Moderat konzentriert
Grafik Erklärung
Gamma und Psi sind die Flächen über und unter den Konfidenzintervallen, für Distanzen geringer als Median.
Ein paar willkürliche Annahmen und Parameter
Warum Mediandistanz?
Wie viele Simulationen?
Konzeptuelles Problem: Was wenn es zwei separate Zentren gibt? Forscher brauchen präzise Definition von was konzentriert bedeutet.
Unter Median sind alle Distanzen gleich wertvoll (Büro nebenan zählt gleich wie Büro 100 Meter entfernt)
Rechenintensiv
Daten und Datenquellen
Schwierig, aber ein erfolgreicher Weg zu guten Publikationen
Gute neue Daten führen oft zu wichtigen Ergebnissen
Beispiel: Harari und Wong (2020): 28000 google street view Fotos um Gebäudehöhe in Jakarta zu messen
Andere Dateninnovationen
Measuring Economic Growth from Outer Space (Henderson, Storeygard, Weil, 2012) (sehr einflussreich als Datenquelle)
Nachtlichter um BIP zu messen
Unabhängig von Ländergrenzen
Erlaubt hohe Auflösung innerhalb von Ländern (interessant für Wirtschaftsgeografen)
Einheitliche Datenquelle
Lichter
Standardquelle für nationale Daten (inklusive BIP): Penn World Tables. Einige Probleme:
Standardfehler für Subsahara Afrika ist zwischen 20 – 30 Prozent
PWT revidiert Zahlen substantiell. Unter den 10 am schnellsten wachsenden Ländern zwischen Versionen 6.1 und 6.2 sind nur etwa 5 aus beiden Listen.
Einige „stilisierte Fakten“, wie etwa die Beziehung zwischen Volatilität und niedrigem BIP könnte nur durch Datenfehler zu erklären sein (Dawson et al 2001)
Ein paar Länder fehlen (etwa Myanmar)
Offizielle Alternativen wie IWF oder Weltbank verwenden offizielle Zahlen und ignorieren den oft sehr großen informellen Sektor
Beispiel: BIP Wachstum vom IWF gemessen durch Stromverbrauch kann um Faktor 10 größer sein als offizielles Wachstum.
US Air Force Defense Meterological Satellite Program fotografiert den gesamten Planeten täglich, zwischen 8:30 und 10 Uhr Lokalzeit. Licht ist die Hauptvariable.
Verfügbare Daten messen Jahresdurchschnitt, rechnen Wolken und Waldbrände raus. (denn: kurzfristige Schwankungen sind „Probleme“)
Raster ist 30 arc-Sekunden (0.86 Quadratkilometer) mit Indikator für Intensität zwischen 0 und 63.
Top coding Problem, in den USA sind 0.6 pct der Lichter bei 63.
In neueren Versionen gelöst.
Blendung (Nachbarzellen werden heller)
Jahre 1992 bis 2008.
Beispiel: Welt
Beispiel 2: Korea
Lichter - Vergleich mit BIP
→ Elastizität von 1 mit linearem Fit scheint gut zu funktionieren.
Nachfolgende Literatur (Beispiele)
Wurde verwendet zum Beispiel für
Effekte von Fluten und Erdbeben,
Urbanisierung in Afrika (Geschwindigkeit und Ausmaß),
Evaluierung von Hilfsprogrammen,
Nachverfolgung von Epidemien,
Migrationsbewegungen nach Krisen.
GRUMP: Global Rural-Urban Mapping Project, NASA und Columbia University Projekt dass globale Bevölkerung in einem Raster darstellt.
Tageslicht Satelliten
Sich entwickelnde Technologie
Viel höhere Resolution als bei Nachtlicht
Mehr Information (Farben, Winkelaufnahmen)
Anwendungsfeld für neue KI Technologien (?)
Produktivitätsvariablen
Von großer Bedeutung aber schwer zu finden
Residuum als Maß (Solow Residuum)
Preis als Proxy
Größe als Proxy
Produktion pro Kopf als Proxy
Ein paar Papiere in letzter Zeit haben verwendet:
Mobilfunkdaten zur Position von Menschen
Oyster Karten zur UBahn in London
Facebook Daten
Google Suchen / Online Reviews
Bibliothekskarten
Miyauchi et al 2021
Miyauchi, Nakajima und Redding (2021) working paper, `Consumption Access and Agglomeration: Evidence from Smartphone data'
Smartphone Daten die Position in Tokio alle 5 Minuten messen
Fakten zu Mobilität in Städten
Nicht arbeitsrelevante Trips sind häufig
Lokaler als Pendeln zur Arbeit o Häufige Trip-Ketten
Mit Hilfe eines quantitativen Modells schließt die Studie:
Pendelmodell alleine ist irreführend
Konsum ist auch wichtig um Landpreisvariation zu erklären
Wohlfahrtsgewinne von Transportinvestitionen wird unterschätzt, wenn Konsum ignoriert wird
Muster in Reisetätigkeit auch falsch, wenn Konsum ignoriert wird
Datensatz
Japanische Kartenapp (Dokomo Chizu NAVI)
Bestimmt Position durch GPS alle 5 Minuten, unabhängig davon ob die App offen ist oder nicht
`Aufenthalt' ist keine Bewegung innerhalb von 100 Metern für 15 Minuten
1.4 Milliarden Datenpunkte zu 545,000 Benutzern alleine im Juli 2019
Zensusdaten um Orte zu klassifizieren
Miyauchi et al
Reiches quantitatives Modell wird hier übergangen
Implikation: Konsum ist wichtig für Agglomeration
Schwer nachzuweisen wegen Datenproblemen
Quantifizierung wichtig
Standardfehler
Autokorrelation von Standardfehlern in geografischen Schätzungen
Lösung: Conley Standardfehler oder Conley, Bester, Hanson (2002) Raster
Morgan Kelly (2019): Simulationen zeigen, dass falsche Signifikanz in geografischen Daten leicht zu erzeugen ist
Viele Papiere könnten falsche Positive beinhalten. (Er ersetzt die wichtigste Erklärende oder Erklärte Variable mit geografischem Geräusch und zeigt, dass die t-Statistiken hoch bleiben)
Mehr Ökonometrische Arbeit ist hier nötig
Zuletzt geändertvor 2 Jahren