# Classification des Micro-r√©gions de Corse par K-NN

Ce notebook impl√©mente un syst√®me de classification des micro-r√©gions corses bas√© sur l'algorithme des k plus proches voisins (k-NN). Cliquez sur la carte pour identifier la micro-r√©gion correspondante.

In [None]:
# Installation des biblioth√®ques n√©cessaires
!pip install folium pandas numpy scikit-learn geopy --quiet

In [None]:
import pandas as pd
import numpy as np
import folium
from folium import plugins
from sklearn.neighbors import KNeighborsClassifier
from geopy.geocoders import Nominatim
from geopy.extra.rate_limiter import RateLimiter
import time
from IPython.display import display, HTML
import json

## 1. Chargement et pr√©paration des donn√©es

In [None]:
# Chargement du fichier CSV
df = pd.read_csv('communes-par-territoire-de-projet-de-la-collectivite-territoriale-de-corse0.csv', 
                 sep=';', encoding='utf-8')

print(f"Nombre de communes: {len(df)}")
print("\nPremi√®res lignes:")
display(df.head())
print("\nTerritoires de projet (micro-r√©gions):")
print(df['Territoire de projet'].unique())

## 2. G√©ocodage des communes

Si le fichier ne contient pas d√©j√† les coordonn√©es GPS, nous les r√©cup√©rons via g√©ocodage.

In [None]:
# Fonction pour obtenir les coordonn√©es GPS d'une commune
def geocode_commune(commune, departement, code_postal):
    """
    G√©ocode une commune corse pour obtenir ses coordonn√©es GPS
    """
    geolocator = Nominatim(user_agent="corse_knn_classifier")
    
    try:
        # Essai avec le nom de la commune et Corse
        query = f"{commune}, Corse, France"
        location = geolocator.geocode(query, timeout=10)
        
        if location:
            return location.latitude, location.longitude
        
        # Essai avec le code postal
        query = f"{commune}, {code_postal}, France"
        location = geolocator.geocode(query, timeout=10)
        
        if location:
            return location.latitude, location.longitude
            
    except Exception as e:
        print(f"Erreur pour {commune}: {e}")
    
    return None, None

# V√©rifier si les colonnes GPS existent d√©j√†
if 'Latitude' not in df.columns or 'Longitude' not in df.columns:
    print("G√©ocodage des communes en cours... (cela peut prendre quelques minutes)")
    
    # G√©ocodage avec rate limiting pour respecter les limites de l'API
    latitudes = []
    longitudes = []
    
    for idx, row in df.iterrows():
        lat, lon = geocode_commune(row['Commune'], row['D√©partement'], row['Code Postal'])
        latitudes.append(lat)
        longitudes.append(lon)
        
        # Affichage de la progression
        if (idx + 1) % 10 == 0:
            print(f"Progression: {idx + 1}/{len(df)} communes g√©ocod√©es")
        
        # Pause pour respecter les limites de l'API
        time.sleep(1.5)
    
    df['Latitude'] = latitudes
    df['Longitude'] = longitudes
    
    # Sauvegarde du dataframe avec coordonn√©es
    df.to_csv('communes_corse_avec_gps.csv', sep=';', index=False, encoding='utf-8')
    print("\nG√©ocodage termin√© et sauvegard√© dans 'communes_corse_avec_gps.csv'")
else:
    print("Les coordonn√©es GPS sont d√©j√† pr√©sentes dans le fichier.")

# Supprimer les lignes sans coordonn√©es
df_clean = df.dropna(subset=['Latitude', 'Longitude']).copy()
print(f"\nCommunes avec coordonn√©es GPS: {len(df_clean)}/{len(df)}")

## 3. Entra√Ænement du mod√®le k-NN

In [None]:
# Pr√©paration des donn√©es pour k-NN
X = df_clean[['Latitude', 'Longitude']].values
y = df_clean['Territoire de projet'].values

# Cr√©ation du mod√®le k-NN avec k=5 (ajustable)
k = 5
knn = KNeighborsClassifier(n_neighbors=k, weights='distance', metric='haversine')

# Conversion des coordonn√©es en radians pour la distance haversine
X_rad = np.radians(X)

# Entra√Ænement du mod√®le
knn.fit(X_rad, y)

print(f"Mod√®le k-NN entra√Æn√© avec k={k} voisins")
print(f"Nombre de micro-r√©gions: {len(np.unique(y))}")
print(f"Micro-r√©gions: {sorted(np.unique(y))}")

## 4. Cr√©ation de la carte interactive avec Folium

In [None]:
# Couleurs pour chaque micro-r√©gion
microregions = sorted(df_clean['Territoire de projet'].unique())
colors = ['red', 'blue', 'green', 'purple', 'orange', 'darkred', 
          'lightred', 'beige', 'darkblue', 'darkgreen', 'cadetblue', 
          'darkpurple', 'pink', 'lightblue', 'lightgreen', 'gray', 'black', 'lightgray']

color_map = {region: colors[i % len(colors)] for i, region in enumerate(microregions)}

print("Carte des couleurs par micro-r√©gion:")
for region, color in color_map.items():
    print(f"  {region}: {color}")

In [None]:
# Coordonn√©es du centre de la Corse
center_lat = df_clean['Latitude'].mean()
center_lon = df_clean['Longitude'].mean()

# Cr√©ation de la carte
m = folium.Map(
    location=[center_lat, center_lon],
    zoom_start=9,
    tiles='OpenStreetMap'
)

# Ajout des marqueurs pour chaque commune
for idx, row in df_clean.iterrows():
    folium.CircleMarker(
        location=[row['Latitude'], row['Longitude']],
        radius=3,
        popup=f"<b>{row['Commune']}</b><br>{row['Territoire de projet']}",
        tooltip=row['Commune'],
        color=color_map[row['Territoire de projet']],
        fill=True,
        fillColor=color_map[row['Territoire de projet']],
        fillOpacity=0.7
    ).add_to(m)

# Ajout d'une l√©gende
legend_html = '''
<div style="position: fixed; 
            top: 10px; right: 10px; width: 250px; height: auto; 
            background-color: white; border:2px solid grey; z-index:9999; 
            font-size:12px; padding: 10px">
<p style="margin-bottom: 5px;"><b>Micro-r√©gions de Corse</b></p>
'''

for region, color in sorted(color_map.items()):
    legend_html += f'<p style="margin: 3px 0;"><i class="fa fa-circle" style="color:{color}"></i> {region}</p>'

legend_html += '</div>'

m.get_root().html.add_child(folium.Element(legend_html))

# Ajout du plugin de clic
# Note: Folium ne supporte pas nativement l'interactivit√© c√¥t√© Python en temps r√©el
# Nous allons cr√©er une version avec JavaScript pour la pr√©diction

print("Carte de base cr√©√©e avec les communes color√©es par micro-r√©gion")

## 5. Carte interactive avec pr√©diction au clic

Cette version utilise JavaScript pour permettre de cliquer sur la carte et afficher la micro-r√©gion pr√©dite.

In [None]:
# Cr√©ation d'une nouvelle carte avec interaction JavaScript
m_interactive = folium.Map(
    location=[center_lat, center_lon],
    zoom_start=9,
    tiles='OpenStreetMap'
)

# Ajout des communes
for idx, row in df_clean.iterrows():
    folium.CircleMarker(
        location=[row['Latitude'], row['Longitude']],
        radius=3,
        popup=f"<b>{row['Commune']}</b><br>{row['Territoire de projet']}",
        tooltip=row['Commune'],
        color=color_map[row['Territoire de projet']],
        fill=True,
        fillColor=color_map[row['Territoire de projet']],
        fillOpacity=0.7
    ).add_to(m_interactive)

# Pr√©parer les donn√©es des communes pour JavaScript
communes_data = df_clean[['Latitude', 'Longitude', 'Commune', 'Territoire de projet']].to_dict('records')

# JavaScript pour la pr√©diction k-NN au clic
click_js = f"""
<script>
// Donn√©es des communes
var communesData = {json.dumps(communes_data)};

// Carte des couleurs
var colorMap = {json.dumps(color_map)};

// Fonction pour calculer la distance haversine
function haversineDistance(lat1, lon1, lat2, lon2) {{
    const R = 6371; // Rayon de la Terre en km
    const dLat = (lat2 - lat1) * Math.PI / 180;
    const dLon = (lon2 - lon1) * Math.PI / 180;
    const a = Math.sin(dLat/2) * Math.sin(dLat/2) +
              Math.cos(lat1 * Math.PI / 180) * Math.cos(lat2 * Math.PI / 180) *
              Math.sin(dLon/2) * Math.sin(dLon/2);
    const c = 2 * Math.atan2(Math.sqrt(a), Math.sqrt(1-a));
    return R * c;
}}

// Fonction k-NN
function predictRegion(lat, lon, k) {{
    // Calculer les distances
    var distances = communesData.map(function(commune) {{
        return {{
            distance: haversineDistance(lat, lon, commune.Latitude, commune.Longitude),
            region: commune['Territoire de projet'],
            commune: commune.Commune
        }};
    }});
    
    // Trier par distance
    distances.sort((a, b) => a.distance - b.distance);
    
    // Prendre les k plus proches
    var kNearest = distances.slice(0, k);
    
    // Vote pond√©r√© par l'inverse de la distance
    var votes = {{}};
    kNearest.forEach(function(neighbor) {{
        var weight = 1 / (neighbor.distance + 0.001); // +0.001 pour √©viter division par 0
        if (votes[neighbor.region]) {{
            votes[neighbor.region] += weight;
        }} else {{
            votes[neighbor.region] = weight;
        }}
    }});
    
    // Trouver la r√©gion gagnante
    var maxVote = 0;
    var predictedRegion = '';
    for (var region in votes) {{
        if (votes[region] > maxVote) {{
            maxVote = votes[region];
            predictedRegion = region;
        }}
    }}
    
    return {{
        region: predictedRegion,
        neighbors: kNearest
    }};
}}

// Variable pour stocker le marqueur de pr√©diction
var predictionMarker = null;
var neighborLines = [];

// Attendre que la carte soit charg√©e
setTimeout(function() {{
    var maps = document.querySelectorAll('.folium-map');
    if (maps.length > 0) {{
        var mapElement = maps[maps.length - 1];
        var leafletMap = mapElement._leaflet_map;
        
        if (leafletMap) {{
            leafletMap.on('click', function(e) {{
                var lat = e.latlng.lat;
                var lon = e.latlng.lng;
                
                // Pr√©diction avec k={k}
                var result = predictRegion(lat, lon, {k});
                
                // Supprimer l'ancien marqueur et lignes
                if (predictionMarker) {{
                    leafletMap.removeLayer(predictionMarker);
                }}
                neighborLines.forEach(function(line) {{
                    leafletMap.removeLayer(line);
                }});
                neighborLines = [];
                
                // Cr√©er le popup avec informations d√©taill√©es
                var popupContent = '<div style="min-width: 200px;">' +
                    '<h4 style="margin: 5px 0;">Pr√©diction k-NN</h4>' +
                    '<p style="margin: 5px 0;"><b>Micro-r√©gion:</b> ' + result.region + '</p>' +
                    '<p style="margin: 5px 0;"><b>Coordonn√©es:</b><br>' + 
                    'Lat: ' + lat.toFixed(5) + '<br>Lon: ' + lon.toFixed(5) + '</p>' +
                    '<p style="margin: 5px 0;"><b>{k} plus proches communes:</b></p>' +
                    '<ul style="margin: 5px 0; padding-left: 20px; font-size: 11px;">';
                
                result.neighbors.forEach(function(neighbor) {{
                    popupContent += '<li>' + neighbor.commune + 
                        ' (' + neighbor.distance.toFixed(2) + ' km)</li>';
                }});
                
                popupContent += '</ul></div>';
                
                // Ajouter le nouveau marqueur
                predictionMarker = L.marker([lat, lon], {{
                    icon: L.divIcon({{
                        className: 'prediction-marker',
                        html: '<div style="background-color: ' + colorMap[result.region] + 
                              '; width: 20px; height: 20px; border-radius: 50%; ' +
                              'border: 3px solid white; box-shadow: 0 0 10px rgba(0,0,0,0.5);"></div>',
                        iconSize: [20, 20]
                    }})
                }}).addTo(leafletMap);
                
                predictionMarker.bindPopup(popupContent).openPopup();
                
                // Ajouter des lignes vers les k plus proches voisins
                result.neighbors.forEach(function(neighbor) {{
                    var commune = communesData.find(c => c.Commune === neighbor.commune);
                    if (commune) {{
                        var line = L.polyline(
                            [[lat, lon], [commune.Latitude, commune.Longitude]],
                            {{
                                color: 'gray',
                                weight: 1,
                                opacity: 0.5,
                                dashArray: '5, 5'
                            }}
                        ).addTo(leafletMap);
                        neighborLines.push(line);
                    }}
                }});
            }});
            
            console.log('Gestionnaire de clic k-NN activ√©');
        }}
    }}
}}, 1000);
</script>
"""

m_interactive.get_root().html.add_child(folium.Element(click_js))

# Ajout de la l√©gende
m_interactive.get_root().html.add_child(folium.Element(legend_html))

# Ajout d'instructions
instructions_html = '''
<div style="position: fixed; 
            bottom: 10px; left: 10px; width: 300px; 
            background-color: white; border:2px solid grey; z-index:9999; 
            font-size:13px; padding: 10px">
<p style="margin: 0;"><b>üñ±Ô∏è Instructions:</b></p>
<p style="margin: 5px 0;">Cliquez n'importe o√π sur la carte pour pr√©dire la micro-r√©gion √† partir de l'algorithme k-NN.</p>
<p style="margin: 5px 0;">Les lignes pointill√©es montrent les k plus proches communes utilis√©es pour la pr√©diction.</p>
</div>
'''

m_interactive.get_root().html.add_child(folium.Element(instructions_html))

print("Carte interactive cr√©√©e avec succ√®s!")
print(f"\nCliquez sur n'importe quel point de la carte pour pr√©dire sa micro-r√©gion avec k={k} voisins.")

In [None]:
# Affichage de la carte interactive
m_interactive

## 6. Sauvegarde de la carte

In [None]:
# Sauvegarder la carte interactive
m_interactive.save('carte_corse_knn_interactive.html')
print("Carte sauvegard√©e dans 'carte_corse_knn_interactive.html'")
print("Vous pouvez ouvrir ce fichier dans un navigateur pour une utilisation autonome.")

## 7. Test de la pr√©diction (optionnel)

In [None]:
# Fonction pour tester la pr√©diction sur des coordonn√©es sp√©cifiques
def predict_region(lat, lon, k_value=5):
    """
    Pr√©dit la micro-r√©gion pour des coordonn√©es donn√©es
    """
    # Conversion en radians
    coords_rad = np.radians([[lat, lon]])
    
    # Pr√©diction
    prediction = knn.predict(coords_rad)[0]
    
    # Trouver les k plus proches voisins
    distances, indices = knn.kneighbors(coords_rad)
    
    # Convertir les distances de radians en km
    distances_km = distances[0] * 6371  # Rayon de la Terre en km
    
    print(f"\nüìç Coordonn√©es: {lat:.5f}, {lon:.5f}")
    print(f"üéØ Micro-r√©gion pr√©dite: {prediction}")
    print(f"\n{k_value} plus proches communes:")
    
    for i, idx in enumerate(indices[0]):
        commune_info = df_clean.iloc[idx]
        print(f"  {i+1}. {commune_info['Commune']} ({commune_info['Territoire de projet']}) - {distances_km[i]:.2f} km")
    
    return prediction

# Exemples de test
print("=" * 60)
print("TESTS DE PR√âDICTION")
print("=" * 60)

# Test 1: Centre approximatif de la Corse
predict_region(42.15, 9.15, k)

# Test 2: Nord de la Corse (Balagne)
predict_region(42.55, 8.85, k)

# Test 3: Sud de la Corse
predict_region(41.65, 9.15, k)

## 8. Analyse de performance (optionnel)

In [None]:
# √âvaluation de la coh√©rence du mod√®le (cross-validation)
from sklearn.model_selection import cross_val_score

# Test avec diff√©rentes valeurs de k
k_values = [3, 5, 7, 9, 11]
scores = []

print("√âvaluation de la pr√©cision pour diff√©rentes valeurs de k:\n")

for k_val in k_values:
    knn_temp = KNeighborsClassifier(n_neighbors=k_val, weights='distance', metric='haversine')
    cv_scores = cross_val_score(knn_temp, X_rad, y, cv=5)
    mean_score = cv_scores.mean()
    scores.append(mean_score)
    print(f"k={k_val:2d}: Pr√©cision moyenne = {mean_score:.3f} (+/- {cv_scores.std():.3f})")

# Visualisation simple
print(f"\n‚ú® Meilleure valeur de k: {k_values[scores.index(max(scores))]} (pr√©cision: {max(scores):.3f})")

## Conclusion

Ce notebook impl√©mente un classificateur k-NN pour les micro-r√©gions de Corse avec:
- ‚úÖ Chargement et g√©ocodage des communes corses
- ‚úÖ Entra√Ænement d'un mod√®le k-NN avec distance haversine
- ‚úÖ Carte interactive Folium avec pr√©diction au clic
- ‚úÖ Visualisation des k plus proches voisins
- ‚úÖ L√©gende et instructions pour l'utilisateur

**Utilisation:**
1. Cliquez n'importe o√π sur la carte
2. Un marqueur color√© appara√Æt avec la micro-r√©gion pr√©dite
3. Des lignes pointill√©es montrent les k communes les plus proches
4. Un popup d√©taille la pr√©diction et les voisins

La carte HTML peut √™tre ouverte dans n'importe quel navigateur pour une utilisation autonome!