🧬 FCG-MFD: Malware Family Detection Dataset

Benchmark dataset using Function Call Graphs (FCG) for malware detection and classification

📌 Overview

The FCG-MFD dataset is a large-scale benchmark dataset designed for malware family detection and classification using Function Call Graphs (FCG).

It contains 100,000 samples (50K malware + 50K benign) collected from multiple real-world sources.

This dataset enables advanced research in:

Malware detection
Family classification
Graph-based machine learning
Cyber threat intelligence

📊 Dataset Highlights

✅ 100,000 total samples
✅ 50,000 malware samples
✅ 50,000 benign samples
✅ 35+ malware families
✅ Function Call Graph (FCG) representation
✅ Metadata + behavioral features

🧬 Malware Categories

Trojan
Ransomware
Worms
Backdoor
Botnet
Virus

🧠 Methodology

The dataset is constructed using:

Malware sources:
- VirusShare
- VirusSample
- MalwareBazaar
- VX-Underground
- theZoo
Analysis tools:
- VirusTotal
- Cuckoo Sandbox
Feature extraction:
- Function Call Graphs (FCG)
- Behavioral analysis
- Metadata (MD5, PE info)

🧪 Applications

Malware detection
Malware family classification
Graph Neural Networks (GNN)
Intrusion Detection Systems (IDS)
Cybersecurity research

📜 Citation

If you use this dataset, please cite:

@article{HADI2025104050,
title = {FCG-MFD: Benchmark function call graph-based dataset for malware family detection},
journal = {Journal of Network and Computer Applications},
volume = {233},
pages = {104050},
year = {2025},
issn = {1084-8045},
doi = {https://doi.org/10.1016/j.jnca.2024.104050},
url = {https://www.sciencedirect.com/science/article/pii/S1084804524002273},
author = {Hassan Jalil Hadi and Yue Cao and Sifan Li and Naveed Ahmad and Mohammed Ali Alshara},
keywords = {Malware detection, Malware family classification, Function Call Graph, Dataset},
}

👨‍💻 Maintainer

CyberSar Lab 🔗 https://cybersar.kaust.edu.sa/

🛡️ Advancing Malware Analysis with Graph-Based Intelligence

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
Benign		Benign
Dataset Creation		Dataset Creation
FCG-Model		FCG-Model
Metadata Dataset		Metadata Dataset
Backdoor Family.zip		Backdoor Family.zip
Botnet Family.zip		Botnet Family.zip
FCG.png		FCG.png
README.md		README.md
Trojans Family.zip		Trojans Family.zip
Virus Family.zip		Virus Family.zip
Worms Family.zip		Worms Family.zip
dataset2.csv.zip		dataset2.csv.zip

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🧬 FCG-MFD: Malware Family Detection Dataset

📌 Overview

📊 Dataset Highlights

🧬 Malware Categories

🧠 Methodology

🧪 Applications

📜 Citation

👨‍💻 Maintainer

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🧬 FCG-MFD: Malware Family Detection Dataset

📌 Overview

📊 Dataset Highlights

🧬 Malware Categories

🧠 Methodology

🧪 Applications

📜 Citation

👨‍💻 Maintainer

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages